Title: Introduction au Web smantique
1Introduction au Web sémantique
- N. Aussenac-Gilles (IRIT) aussenac_at_irit.fr
- Le site dun groupe de chercheur qui a fait le
point en 2003 - http//www.lalic.paris4.sorbonne.fr/stic/ -gt des
tutoriels, un excellent rapport final - http//www.w3.org/2001/sw/Activity
- Cours de Fabio Civaregna Intelligent Web
http//www.dcs.shef.ac.uk/7Efabio/COM4280/ - http//websemantique.org/
2Le Web Sémantique profession de foi
- The Semantic Web is an extension of the current
web in which information is given well-defined
meaning, better enabling computers and people to
work in cooperation. The mix of content on the
web has been shifting from exclusively
human-oriented content to more and more data
content. - The Semantic Web brings to the web the idea of
having data defined and linked in a way that it
can be used for more effective discovery,
automation, integration, and reuse across various
applications. For the web to reach its full
potential, it must evolve into a Semantic Web,
providing a universally accessible platform that
allows data to be shared and processed by
automated tools as well as by people. - W3C Semantic Web Activity Statement
3Plan du cours
- Introduction au web sémantique
- Motivations, Définitions
- Scenarios envisagés
- Les défis technologiques
- Solutions techniques prévues
- Le modèle en couches
- Ontologies, méta-données, services web
- Les ontologies représentation du sens
- Les ontologies définition
- OWL
- Intérêt de la formalisation
- Difficulté de la construction
- TAL et apprentissage
4Plan du cours (suite)
- Donner du sens aux documents du web
- Des textes aux ontologies
- Des ontologies et des méta-données aux pages web
- Annotation
- indexation,
- Recherche dinformation et ontologies
- Regard critique
- Le web sémantique une utopie ou une réalité
dans 5 ans ? - Les technologies du web sémantique que retenir ?
5Cours 1 Introduction au web sémantique
- Motivations, Définitions
- Scenarios envisagés
- Les défis technologiques
- Solutions techniques prévues
- Le modèle en couches
- Ontologies
- Méta-données
- Services web
61 - Motivations
- Le web a un énorme potentiel mal exploité
- Aller vers un web intelligent
- Utiliser des connaissances dans les applications
- Rechercher des informations précises, mal
formulées (au delà des mots clés) - Mieux exploiter des informations brutes
(annotation, indexation) - Aider à la résolution de problème
- Gestion des connaissances
- Commerce ciblé
- anticiper des besoins, combiner plusieurs
ressources et applications, utiliser des
heuristiques commerciales, des profils
utilisateurs (Business rules - Offrir des services nouveaux, élaborés
71 Motivations le web aujourdhui
- Données de formats hétérogènes
- Applications incapables daccéder à ces données
- Données brutes, et non connaissances
- Organisation et utilisation
- guidée par loffre, par celui qui met des
informations à disposition, - et non par la demande, par les besoins des
utilisateurs
81 Motivations Le Web aujourd'hui
- Beaucoup d'informations mais la description de
l'information (méta-données) est limitée - HTML ne donne que des liens sans sémantique (non
utilisables par les machines) - Les moteurs de recherche par mots clés laissent
beaucoup de travail à l'utilisateur - Et plus généralement, trouver les bonnes
ressources, analyser le contenu des pages,
dégager les bonnes informations, combiner les
différents résultats est coûteux en temps et
parfois fastidieux ! - L'information et les services sur le Web sont
aujourd'hui peu exploitables par des machines
Et de moins en moins exploitables sans l'aide des
machines
91 - Motivations Le Web de demain vu par le W3C
- un vaste espace d'échanges de ressources entre
machines permettant l'exploitation de grands
volumes d'informations et de services variés,
aidant les utilisateurs en les libérant d'une
(bonne) partie de leur travail de recherche, et
de combinaison de ces ressources - " Le Web sémantique n'est pas un Web séparé,
mais une extension du Web actuel dans lequel
l'information est munie d'une signification bien
définie permettant aux ordinateurs et aux
personnes de mieux travailler en coopération " - traduit de T. Berners-Lee , J. Hendler et
O.Lassila, Scientific American 2001
101 Motivations Sémantiser le Web
- Ajouter des connaissances
- Associées aux pages du web sur-couche
sémantique - Associées aux applications agents logiciels
intelligents, capables de raisonner sur les
descriptions - Définir autrement les applications
- En terme de services web services
- Mieux communiquer, échanger, sécuriser, accéder à
des sources hétérogènes définir des standards - Infrastructures standards protocoles, langages,
mécanismes, ... - Rôle d'une couche sémantique
- Décrire les contenus (métadonnées)
- Structurer les ressources (liens hypertextes
étiquetés) - Anticiper les raisonnements formalisation
111 Motivations Sémantiser le Web
- Les connaissances ajoutées
- Ressources, données -gt documents, ontologies,
données - Règles, heuristiques -gt axiomes, règles
- Algorithmes, modèles de tâches et dinteraction
-gt contrôle, modules de résolution de problème - Proposer des "vocabulaires" partagés pour
différentes communautés - ontologies comme conceptualisations partagées,
au cur du WS - Permettent dexprimer différents types de
métadonnées
121 Motivations Méta-données, annotations et
ontologies
Le Web aujourd'hui
Le Web Sémantique
Software ontology
Person ontology
Les ontologies
W3C Semantic Web Activity, Koivunen and Miller,
2001
132 - Scénario (1) le moteur de recherche
sémantique
- Trouver des informations sur des monuments à
Paris restaurés par un architecte élève de
Viollet le Duc - http//web.mit.edu/museum/ware/viollet_le_duc.html
- Le site concerne Viollet le Duc
- Viollet le Duc est un architecte
- Viollet le Duc a comme élève Paul Boeswillwald
- http//www.mediatheque-patrimoine.culture.gouv.fr/
fr/biographies/boeswillwald_paul.html - Le site concerne Paul Boeswillwald
- Paul Boeswillwald est un architecte
- http//www.musee-moyenage.fr/pages/page_id18390_u1
l2.htm - A comme nom Hotel de Cluny
- Restauré par Paul Boeswillwald
- A comme lieu Paris
Méta-données associées aux sites
Liens étiquetés entre sites
142 - Scénario (2) objets pédagogiques
- Trouver des cours sur le Web sémantique, de
niveau avancé, avec des exercices associés dans
une université parisienne. - Chaque document ( cours, exercices, ), associé à
une URL (cas particulier des URI), a ses
méta-données et est relié aux autres ressources
par certaines relations - Peut utiliser certains standards comme LOM
(Learning object metadata)
152 - Scénario (3) lorganisation de la visite
dune ville
- Un outil dédié exploite et combine les
ressources pour une tâche donnée - Descriptions de ressources touristiques précises
méta-données - Les différents musées, monuments,
- Réutilisation dune ontologie des objets
culturels et historiques - Connaissances générales sur le tourisme
ontologie - Les différents moyens de transport sont
- Connaissances sur les préférences de
lutilisateur profil attaché à sa page Web
personnelle comme un ensemble de méta-données - Art Baroque, Art nouveau, Le Gréco,
- Connaissances sur les itinéraires
162 - Scénario Implications du scénario (3)
- Loutil dédié
- peut utiliser les mêmes langages de
représentation des ontologies et de méta-données
RDF, OWL - nécessite en plus lintégration de sources de
données hétérogènes et la médiation de requêtes
globales vers des structures locales - musées ayant chacun leur format de métadonnées
.. -
- nécessite des capacités de raisonnement
formalisation
172 - Scénario (4) les services Web ..
sémantiques
- Un outil qui fait appel, exploite et combine des
services - Réservation dun musée, dun guide, dun bateau
- Commande de brochures
- Accès aux services Web proposés par le portail du
musée, de la compagnie de bateau - Accès aux services Web de réservation des guides
de la ville -
182 - Scénario (5) Aide à la navigation
sémantique
- Voir le Web comme un vaste réseau interconnecté
par des liens sémantiques - Utilisation dun portail de formation à distance
- Navigation dans des ressources touristiques
- Des liens étiquetés
- utilisables par les êtres humains
- utilisables par les machines
- Nécessité de méthodes (et d'outils) pour
présenter ou visualiser - localement
- des parties du Web
193 Défis technologiques
- Les langages pour le WS
- Méta-données
- Ontologies pour le WS
- Logiciels dannotations associer ontologies et
ressources (pages, BD, etc.) - Intégration de sources d'information hétérogènes
- Services Web sémantiques
- Sécurisation
- Personnalisation et adaptation
- http//rtp-doc.enssib.fr/
- http//rtp-doc.enssib.fr/archiveas.html
- http//www.lalic.paris4.sorbonne.fr/stic/
203 Défis humains
- Les langages pour le WS utilisabilité
- Méta-données consensus au sein de communautés
- Ontologies pour le WS comment les construire ?
Les utiliser ? - Logiciels dannotations associer ontologies et
ressources (pages, BD, etc.) Qui va annoter ? - Intégration de sources d'information hétérogènes
logique dusage - Services Web sémantiques logique dusage
- Personnalisation et adaptation
- http//rtp-doc.enssib.fr/
- http//rtp-doc.enssib.fr/archiveas.html
- http//www.lalic.paris4.sorbonne.fr/stic/
213 Défis humains
- Le web sémantique a un coût
- Développer des ontologies
- Annoter des pages, des ressources
- Modéliser des besoins dutilisateurs
- Qui va le prendre en charge ?
- Auteurs des pages
- Utilisateurs
- Gestionnaires du web
- Développeurs dapplications innovantes (et
rémunératrices) - http//rtp-doc.enssib.fr/
- http//rtp-doc.enssib.fr/archiveas.html
- http//www.lalic.paris4.sorbonne.fr/stic/
224 - Les solutions techniques
- Un modèle en couches
- Des langages standards
- Des ontologies
- Des méta-données
234 - Les solutions techniques le modèle en
couches du W3C
244 - Les solutions techniques Niveau 1 les URI
- Uniform Resource Identifiers
- Plusieurs sortes dURL, comme
- URN Universal Resource Names noms uniques
- URL Universal Resource Locators accès à des
ressources - Unicode à la place de ASCII pour gérer le
multi-linguisme
254 - Les solutions techniques Niveau 2 XML
- Pourquoi XML ?
- format standard pour sérialiser des données à
laide de tags - Profiter du succès de HTML, dont il est proche
- Ajouter de la rigueur
- Profiter des nombreux outils
- XSLT pour la transformation
- Parsers
- Langages de schémas pour la validation (comme XML
schéma) - Interrogation grâce à Xquery
- Les espaces de noms XML
- Xmlns http//www.wireless-village.org/CSP1.0
- Qualifieur (vocabulaire) fragment (élément)
- Ontologies concepts
264 - Les solutions techniques Niveau 2 XML
- Exemple
- ltWV-CSP-Message xmlns"http//www.wireless-village
.org/CSP1.0"gt - ltTransactionContent xmlns"http//www.wireless-vi
llage.org/TRC1.0"gt - ltCapabilityListgt
- ltClientTypegtMOBILE_PHONElt/ClientTypegt
- ltInitialDeliveryMethodgtPlt/InitialDeliveryMetho
dgt - ltAcceptedContentLengthgt32767lt/AcceptedContentL
engthgt - lt/CapabilityListgt
- lt/TransactionContentgt
- lt/WV-CSP-Messagegt
274 - Les solutions techniques Niveau 3 RDF
- Resource Description Framework
- Au départ standard de description de méta-données
(97-99) - Utilisation de graphes étiquetés orientés
- triplets sujet propriété (prédicat) - objet
- ou ressource - propriété - valeur (ressource ou
chaîne) - Utilise les URIs
- utilisables pour les pages (et parties de pages)
- mais aussi pour tout objet qui dispose d un
schéma URI (documents, ) - Dispose d'une syntaxe XML
- et des espaces de nom XML
- RDF Schema (98-2000)
- modèle de classes . sur RDF
284 - Les solutions techniques Niveau 3 Le
modèle de base de RDF
- Les triplets ( statements )
- une propriété dune certaine ressource a telle
valeur ou correspond à telle ressource
http//www.lalic.paris4.sorbonne.fr/laublet/coursR
epConnaissances
createur
illustréPar
http//www.lalic.paris4.sorbonne.fr/annuaire/laubl
et.html
http//.....// exercices
nom
e-mail
Philippe.Laublet_at_paris4.sorbonne.fr
Philippe Laublet
294 - Les solutions techniques Niveau 3 La
syntaxe XML de RDF
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdf"http//www.w3.org/1999/02/22-rdf-synt
ax-ns" - xmlnss"http// www.lalic.paris4.sorbonne.fr/sc
hema"gt - ltrdfDescription about"http//www.lalic.paris4.so
rbonne.fr/laublet/tutorielWS2002" gt - ltsrefAuteur resource"http//www.lalic.paris4
.sorbonne.fr/annuaire/p.laublet" /gt - lt/rdfDescriptiongt
- ltrdfDescription about "http//www.lalic.paris4.s
orbonne.fr/annuaire/p.laublet" gt - ltsnomgtPhilippe Laubletgt lt/snomgt
- ltse-mailgtPhilippe.Laublet_at_paris4.sorbonne.frgt
lt/se-mailgt - lt/rdfDescriptiongt
- lt/rdfRDFgt
- Des syntaxes abrégées existent dans certains cas
304 - Les solutions techniques Niveau 3 Les
énoncés sur les énoncés
filiale
Société123-45
Société48
référence
http//www.catalogueSociétés.org
- ltrdfDescription gt
- ltrdfsubject resource "Société123-45" /gt
- ltrdfpredicate resource "ecofiliale" /gt
- ltrdfobject resource "Société48" /gt
- ltrdftype resource "rdfProperty" /gt
- ltecoréférence resource"http//www.catalogueSoc
iétés.org" /gt - lt/rdfDescriptiongt
314 - Les solutions techniques Niveau 3
Avantages - limites de RDF
- Par rapport aux BD
- Représentation de données semi-structurées
- Très coûteux en mémoire (graphe dont tous les
nuds et les arcs sont indexés) - Format homogène
- Mais fusion pas si simple risque de conflits, à
automatiser si gros volume de données - Il existe une théorie des modèles de RDF
- Définit linterprétation logique dun modèle
- Les sérialisations sont multiples
- Les parseurs XML standards ne fonctionnent pas
- Les parseurs RDF sont lents passer de XML à RDF
- RDF / XML est difficile à comprendre
- À cause des espaces de noms utiliser des
préfixes - myvocabsomeProperty rdfresourcehttp//example.
com/someURIblah/gt
324 - Les solutions techniques Niveau 4 RDFS
- À chaque domaine applicatif peut être associé un
schéma identifié par un préfixe particulier et
correspondant à une URI - Un schéma définit les termes qui seront utilisés
par les descriptions RDF - RDF(S) propose des constructeurs très généraux
permettant de construire ces schémas spécialisés - Ensemble de déclarations de classes et de
propriétés contraintes par les classes - Peut être défini par raffinement du schéma du
noyau RDFS - Les données instances sont ensuite décrites en
utilisant ce nouveau vocabulaire - Représentation d'ontologies simples
- Pas de capacités de raisonnement intégrées dans
le modèle
334 - Les solutions techniques Niveau 4 Le
schéma de base de RDF(S)
- cf. http//www.w3.org/TR/2000/CR-rdf-schema-2000
0327
344 - Les solutions techniques Niveau 4
Contraintes de RDF(S)
cf. http//www.w3.org/TR/2000/CR-rdf-schema-2000
0327
354 - Les solutions techniques Niveau 4 RDF
Schema, exemple
- Les classes spécifiques à un domaine sont
déclarées comme instances de la ressource Class - Les propriétés spécifiques à un domaine comme des
instances de la ressource Property - Les éléments reliés sont contraints
- Ontologie exemple
- ExemplehasEmailAddress (property)
- Domain ExempleHuman , range
exempleEmailAddress - RDF schéma a été défini pour produire des
inférences
364 - Les solutions techniques Niveau 4 RDF
Schema, exemple
374 - Les solutions techniques Niveau 4
Utilisation de RDFS
- Métadonnées aide à la recherche de documents,
aide à la personnalisation - RDFPic pour la recherche d'images numériques
- Collaboration
- systèmes d'annotation - Annotea
- bookmarks partagés
- Cartes de sites, cartes de sujets aide à la
navigation - Thesaurus Limber ( ELSST), ...
- Catalogue de produits UNSPSC, commerce
électronique - Grid computing
-
384 - Les solutions techniques Niveau 5
langages de définition dontologies
- DAML standard DARPA
- OIL proposition dun projet européen
- OWL Ontology Web language
- standard du W3C
- Cf suite du cours
- Langages de représentation des connaissances
inspirés de lIA - Production dinférences
- Validation formelle de propriétés (cardinalité,
transitivité des relations, etc.)
394 - Les solutions techniques Niveau 5
Ontology Web Language (OWL)
- Hiérarchies de Classes
- Hiérarchies de Propriétés
- Types de données simples
- Propriétés objets (relations entre classes)
- Descriptions de classes
- Peuvent être utilisées au lieu de classes nommées
- Énumérations
- EstimationDeCrise oneOf (normal,
dommagesMatériels, grave, trèsGrave - Restrictions
- LieuGéo and atleast (3000, aCommeHabitants)
- Enoncés logiques
- RouteSecours and not RouteTerrestre
404 - Les solutions techniques Niveau 6 règles
- Complément à OWL
- Capacités dinférence sur les vocabulaires, les
données structurées - Même objectif que celui poursuivi avec les BD
déductives
414 - Les solutions techniques Niveau 7, 8, 9
logique, preuves et confiance
- Encore non développés
- FACT et dautres logiques de description
permettent de formaliser les parties les plus
simple de OWL (OWL lite) - Recherches en cours sur la confiance à accorder à
des connaissances trouvées sur le web - comment lattester ?
424 - Les solutions techniques Résumé
- OWL langage de représentation d'ontologies
plus complexes - RDFS langage de classes, simple
- représentation de structures et d'ontologies
simples avec description hiérarchique des
concepts et des propriétés - RDF réseau sémantique de base
- métadonnées, ...
- XML couche de transport syntaxique
434 - Les solutions techniques Méta-données et
annotations
- Grande diversité
- annotations documentaires
- annotations structurelles
- annotations sur les contenus
- ...
- Variété de leur rôles
- catalogage
- recherche d'information
- aide à la navigation
- construction dynamique de ressources adaptation
et personnalisation - ...
- De leurs conditions de productions
- quels acteurs professionnels / usagers de
"base" - statique / dynamique
- ...
444 - Les solutions techniques Diversité des
méta-données exemple - CanCore
- Générales attributs de lobjet pédagogique
- titre, langue, sujet, description
- Cycle de vie circonstances du développement de
lobjet - nom, date de publication, information de
publication et de version - Méta-métadonnées sur le dossier des
métadonnées - contributeurs, langue, date, validation
- Techniques et éducationnelles
- format technique, taille, emplacement
- Pédagogiques
- type de ressources, contexte, niveau dage,
- Droits
- Relations avec dautres ressources
- Classification place dans une classification
- Canadian Core Learning Resource Metadata
Application Profile
454 - Les solutions techniques Ontologies
- Spécifications déclaratives des concepts et des
rôles dans un domaine de discours - Fournissent des vues structurées et partageables
des ressources - Donnent, entre autres, un vocabulaire pour les
méta-données - Par leur formalisation, permettent
l'automatisation de certains raisonnements - http//www.daml.org/ontologies/
464 - Les solutions techniques Les deux rôles
des ontologies
- Définir / fournir une sémantique formelle pour
linformation permettant son exploitation par un
ordinateur - Définir / fournir une sémantique d'un domaine du
monde réel fondée sur un consensus et permettant
de lier le contenu exploitable par la machine
avec sa signification pour les humains
474 - Les solutions techniques ex lontologie
CRM (CIDOC ICOM)
- De très nombreux jeux de méta-données et même
beaucoup de standards dans les institutions
culturelles et historiques - Une solution lontologie du CRM
- 80 classes et 130 propriétés
- Deux hiérarchies par spécialisation
- Standard ISO en 2004 ?
484 - Les solutions techniques Objectifs du CRM
- La médiation de requêtes globales à des
structures locales intégration de sources de
données hétérogènes - Lextraction de faits précis à partir dunités
documentaires plus importantes - La transformation de données pour migrer vers
dautres systèmes - La fusion de données dans des entrepôts de
données plus importants - Un point de départ pour de nouvelles
modélisations conceptuelles
49Types
The ICOM/CIDOC Conceptual Reference Model
refine
Making Sense of Cultural Infodiversity Tony Gill
Actors
Conceptual Objects
Physical Entities
participate in
affect
Temporal Entities
location
within
occur at
Places
50(No Transcript)
514 - Les solutions techniques Laspect temporel
Extrait de la définition du Modèle Conceptuel de
Référence du CIDOC (CRM 3.4)
524 - Les solutions techniques Ontologies,
métadonnées, agents logiciels et utilisateurs
www.semanticweb.org
534 - Les solutions techniques Les services Web
1. Requête UDDI
2. Métadonnées pour des services
Client de Service wEB
Serveur UDDI
2. Requête initiale XML-SOAP
4.5..N Echanges XML-SOAP
Fournisseur de Service Web
544 - Les solutions techniques Sémantiser les
services Web
- Applications accessibles en utilisant les
protocoles Internet standard - effectuent certaines actions ou modifications sur
l'état du monde - Les applications peuvent automatiquement
découvrir et invoquer les e-services qui
satisfont le mieux leur besoin - L'enchaînement (composition et interopérabilité)
des services peut être géré par des outils - Les services Web auront besoin dune couche
sémantique - vers une ontologie des services DAML-S
- Web Services for Digital Libraries Thomas
Hickey / ELAG 2003