Title: Exploitation des facettes et des ontologies semiotiques pour LA GESTION DOCUMENTAIRE
1Exploitation des facettes et des ontologies
semiotiques pour LA GESTION DOCUMENTAIRE
- Yves Marleau, président de Cogniva Information
Solutions - Sabine Mas, , postdoctorante EBSI - UTT
- Manuel Zacklad, professeur des Universités
CNAM - UTT
2Introduction
- Origine de la recherche
- Problématique de la mise en place
dinfrastructures sémantiques unifiées - dernière
tentative en date les ontologies - En France (UTT) critiques issues des recherches
dans le domaine du Web Socio-Sémantique - Travaux canadiens
- Effort pour dépasser les limitations actuelles
outils de gestion de linformation qui sont
souvent peu intégrés (classification, thésaurus,
calendriers de conservation, profils de
métadonnées) - Renouvellement des travaux sur la classification
à facettes dans un contexte académique - Développement dans un contexte de RD
industrielle du modèle ISIS (Integrated Semantic
Information Services) - Collaboration de recherche pour faire coopérer
approches par facettes et par points de vue.
3De la classification hiérarchique à la
classification à facettes
4Document et contexte de production
- Au sein d'une organisation, un document est créé
ou reçu dans le contexte dune fonction et la
réalisation d'une activité administrative ou
opérationnelle donnée. - Le document est défini comme l'initiateur ou la
conséquence dun processus daffaire ou dune
activité. - Afin de pouvoir témoigner de cette activité et
assurer une meilleure interprétation,
authenticité et valeur probante de linformation
contenue dans ces documents, les archivistes et
gestionnaires de documents préconisent une
classification des documents et dossiers basée
sur les fonctions et les activités de
lorganisation (Conseil international des
archives, 1997 International Standard
Organization, 2001).
5Difficultés dusage du schéma de classification
institutionnel
- Vise à permettre lorganisation des documents à
plus ou moins long terme et à faciliter leur
localisation - Mais rarement utilisé par les employés qui
privilégient des schémas de classification plus
personnel -gt Tough Moss 2003, Mas 2007 - Raisons
- Terminologie trop générique
- Pas toujours adapté à leur travail personnel
- Difficile à mettre à jour
6Projet de développement du méta-modèle ISIS
- Développer une infrastructure sémantique à la
fois commune pour les besoins duniformité de la
gestion documentaire et flexible pour organiser
différents types dinformation et de
connaissance, - Automatiser certaines tâches de gestion de
l'information normalement déléguées aux
utilisateurs (e.g. automatisation du processus de
création de métadonnées), - Avoir une meilleure description du contenu et du
contexte de lobjet informationnel, - Relier linformation et les connaissances aux
processus daffaires de haut niveau, - Utiliser un vocabulaire flexible et localisé.
7Contexte, contenu, dossier ou projet
8Facettes de contenu
- Si la théorie des facettes de Ranganathan (1965)
offre une syntaxe de base pour lexpression et la
représentation du sujet d'un document, la liste
des facettes de contenu ne peut être fournie a
priori dans une formule immuable - elle doit plutôt être recherchée de façon
pragmatique par un examen de la documentation
relevant du domaine à traiter, lanalyse
conceptuelle permettant de ramener le nombre
théoriquement illimité des termes dun domaine à
un nombre restreint de facettes (Vickery, 1963). - Une partie du contenu d'un document électronique
peut être extraite automatiquement (e.g. auteur
ou date de création) selon le niveau de
structuration du document. L'autre partie est
analysée "manuellement" (e.g. le corps du texte
ou du message) - On peut toutefois s'attendre à retrouver des
facettes de contenu fondamentales telles que - le Temps (e.g. Quand a eu lieu l'incident relaté
dans le document?), - le Lieu (e.g. Où a eu lieu l'incident relaté dans
le document?), - le Thème (e.g. Quel est le type d'incident?),
- la Personne (e.g. Qui sont les intervenants?).
- À ces quatre facettes peuvent s'ajouter d'autres
dimensions suivant les besoins exprimés
9Facettes de contenu du méta-modèle ISIS
10Les facettes de contexte
- Elles décrivent les liens entre le contenu d'un
document et son environnement administratif ou
opérationnel soit les fonctions et activités de
gestion et dexploitation. - (1) Fonction, (2) Activité, (3) Type de contenu,
(4) Rôle, (5) Poste, (6) Structure
organisationnelle, (7) Acteur
11Facettes de contexte du méta-modèle ISIS
12Contexte, contenu, dossier ou projet
13Classification dun contrat dachat
14Relations sémantiques entre les valeurs des
facettes
- Un des aspects les plus novateurs du métamodèle
ISIS repose dans la création de relations
sémantiques entre les valeurs des facettes - Plutôt que d'avoir des listes de termes
indépendantes les unes des autres, les valeurs
des facettes composant le modèle sont reliées
sémantiquement les unes aux autres. - Ce faisant, on obtient un modèle qui se construit
dynamiquement au fur et à mesure de la sélection
des valeurs, on élimine dans les listes de termes
proposés à l'utilisateur les valeurs non
pertinentes, ce qui restreint le nombre de
valeurs présentes sous chaque facette, facilite
et accélère le processus de description et de
classification des documents par les employés. - La gestion du cycle de vie des documents devient
aussi plus transparente. - Par exemple, la connaissance du poste d'un
employé (e.g. Directeur technique) qui est
dérivée automatiquement à partir du login ou nom
d'utilisateur entré dans le système et qui est
associé à un acteur (e.g. John Doe) permet de
présager des rôles (e.g. Chef de projet,
Administrateur), des activités (e.g. Gestion des
appels d'offres, Suivi et contrôle) qui sont
propres à son rôle et des types de contenu (e.g.
Contrat d'achat, Appel d'offres) reliés à ces
activités. L'attribution automatiquement d'une
règle de conservation devient également possible
suite au choix des valeurs des facettes Fonction,
Activité, Type de contenu et Thème, par exemple.
15(No Transcript)
16Complémentarité entre modèle à facette et modèle
par points de vue
17Forces et faiblesses du modèle à facette
- Envisagée dans une perspective archivistique, une
des forces du modèle à facettes est sa stabilité
dans le temps à léchelle de toute
lorganisation. - Cependant, lobtention de cette stabilité
implique de saccorder de manière durable sur la
sémantique utilisée ce qui, notamment dans le
cadre des facettes de contenu, nest pas une
chose aisée dans un nombre important de
professions (métier de la conception, de la RD,
droit des affaires, marketing, etc.). - Pour faire face au caractère évolutif du contenu
des documents produits dans certains secteurs
professionnels et donc de la terminologie visant
à refléter leur sémantique, un projet de
recherche conjoint a été lancé entre le groupe
socio-sémantique de lUniversité de Technologie
de Troyes et les spécialistes de la
classification à facettes de lUniversité de
Montréal et de la société Cogniva.
18Le Web Socio-Sémantique Une approche issue de
lIngénierie des connaissances
- Le rôle de lIC
- 1. concevoir des systèmes dorganisation des
connaissances pour les supports documentaires
(essentiellement associés au web) - 2. Faciliter lorientation dans les supports de
connaissance ( information) dans le cadre
dactivité denquête (conception, diagnotique,
classification) recherche ouverte
dinformation - Différentes dimensions des connaissances, métier
(juridique, médicale, ingéniérique), sociale
(personnes, institution), esthétique (musique,
arts graphiques)
19Web socio-sémantique une vision du web
différente de celle du WS
- Vision privilégiée du Web instrument de gestion
documentaire facilitant des transactions
coopératives interpersonnelles éventuellement
très asynchrones et distribuées entre des acteurs
individuels et collectifs engagés dans des
échanges, débats, controverses, relevant de
domaines très variés. - Les modalités et les outils de gestion des
documents doivent être pour partie conçus par les
acteurs engagés dans une coopération active - Accent mis davantage sur les associations entre
notions et la sérendipité - Basé une méta-sémiotique (langage) HyperTopic
20HyperTopic trois approches de litem
Sémantique rhétorico-herméneutique thèmes
Ontologies sémiotiques (thèmes ou attributs
heuristiques)
Point de vue
Thème
Thématisation heuristique
Attributs standards
Item (sémiotique ou non)
Ressources documentaires
Spécification référentielle
Ressources
Sémantique référentielle objets et concepts
(requêtes logiques)
Documentation de litem (fouille de texte)
21Exemple de modélisation basée sur HyperTopic
22Facettes et points de vue
- Les approches par facettes comme les approches
par points de vue sont toutes deux basées sur des
Systèmes dOrganisation des Connaissances
multidimensionnels - Mais elles diffèrent par le degré de stabilité
versus évolutivité des termes utilisés pour
exprimer la sémantique des dimensions. - La problématique de la stabilité des termes
entretient une relation étroite avec la nature de
la sémantique sous-jacente, de type
interprétative (ou rhétorico-herméneutique)
versus référentielle
23Sémantique interprétative et référentielle
- La sémantique dun terme est référentielle quand
il est possible de déterminer de manière non
ambigüe si un artefact possède ou non la
caractéristique décrite en procédant à une
analyse de celui-ci selon une procédure
consensuelle. - Par contraste, la sémantique est interprétative
(ou rhétorico-herméneutique ), si la décision
permettant de juger de ladéquation du terme à
lartefact ou à la situation visée, implique de
tenir compte du contexte (et dabord du contexte
discursif) dans lequel ce terme est employé, des
intentions de la personne ayant promu son usage,
des réactions possibles des destinataires en
fonction de leurs problématiques.
24Les SOC selon le type de point de vue utilisé
25Dimension commune ou singulière des dimensions
prise en compte
- Dans le premier cas, critères communs, tous les
acteurs sont censés appréhender les dimensions
même sils peuvent en donner une interprétation
particulière (consensus sur les dimensions). - Dans le second, un groupe dacteurs peut
revendiquer des dimensions spécifiques qui nont
pas à être partagées par dautres. - Le croisement du critère de stabilité de la
sémantique permet de distinguer - les ontologies sémiotiques (points de vue
génériques explicites), - les points de vue subjectifs (particuliers),
- les facettes génériques
- les facettes spécifiques.
26Les SOC selon le caractère plus ou moins évolutif
et commun
27Ontologies sémiotiques(points de vue systémiques
génériques)
- Le recours aux ontologies sémiotiques (points de
vue systémiques génériques) correspond aux
situations dans lesquelles lorganisation ou la
communauté considérée cherche à définir un
ensemble de dimensions explicites et communes
sans quun consensus puisse être immédiatement
établi. - On parle dontologies sémiotiques pour souligner
le fait que la communauté engagée dans la
description vise à produire une vision du monde
sarticulant autour de dimensions communément
reconnues (ontologies), même lon reconnait les
différences de points de vue liées, par exemple,
à la profession considérée - Le processus de définition est progressif et il
est même possible que lon ne parvienne jamais à
une situation totalement stable ou que des
périodes de crise viennent remettre en cause un
consensus établi. - Mais cette vision commune sappuie pour une large
part sur une sémantique interprétative et non
référentielle organiser un fond dimages,
plusieurs métiers techniques partageant des plans
ou des documents, caractériser des pratiques de
clients à partir de rapports, partager des
signets de sites web, des chercheurs constituant
une bibliothèque numérique, etc.
28Points de vue subjectifs (développement dun
style personnel)
- Correspond aux situations dans lesquelles une
dimension danalyse est essentiellement portée
par un acteur, le plus souvent un expert reconnu,
qui représente une pratique singulière sans que
la dimension associée à cette pratique ne soit
nécessairement explicitée ni quelle nait
nécessairement vocation à sinscrire dans un
schéma densemble (par opposition avec le
caractère "systémique" des ontologies
sémiotiques). - Les points de vue subjectifs peuvent
ultérieurement traduire un des points de vue
systémique des ontologies sémiotiques ou rester
propre à un expert particulier. - On peut également considérer des situations dans
lesquelles le même point de vue systémique donne
lieu à différentes déclinaisons plus
"subjectives" invitant à considérer cette
dimension selon différents styles (sur
lopposition entre genre et style voir, par
exemple, Clot, 2008).
29Coopération entre approches par facettes et par
points de vue
30Deux modalités possibles
- Modalité 1 Alors que les facettes permettraient
de traiter les dimensions stables et
standardisées du contexte de production des
documents et de leur contenu (e.g. lieu, temps,
personne), les ontologies sémiotiques et les
points de vue subjectifs seraient utilisés pour
traiter les dimensions du contenu plus complexes
et évolutives (e.g. thèmes, caractéristiques des
objets décrits, usages ou finalités, voir Tableau
4). - Modalité 2 les approches par points de vue
seraient utilisées lors des phases préalables de
lanalyse documentaire. Au fur et à mesure que la
sémantique se stabiliserait pour la communauté
considérée, il deviendrait possible (pour
certaines dimensions) de passer à un mode
représentation par facettes, dont les valeurs
seraient plus stables et plus facilement
combinables avec dautres facettes, par exemple,
de contexte.
31Opérationnalisation
- Fédérer les infrastructures sémantiques ISIS et
HyperTopic pour permettre de combiner les
différents types de sémantiques associées aux
modèles. - Meilleure gestion possible de la diversité des
approches de la signification, allant des
approches basées sur la mesure et les conventions
administratives univoques aux approches recourant
à des processus interprétatifs divers et
créatifs.
32Conclusion
33Supériorité des approches par facettes par
rapport au paradigme hiérarchique
- L'exploitation des facettes constitue une
solution alternative très riche au paradigme
hiérarchique pour lorganisation documentaire au
sein des entreprises. - Les études et expériences présentement réalisées
au sein de plusieurs organisations publiques
canadiennes (e.g. Bibliothèque et Archives
Canada, Développement Économique Canada) semblent
indiquer que la souplesse, lexpressivité et la
simplicité du métamodèle à facettes ISIS, mettant
en relation le contenu thématique d'un document
et le contexte dans lequel il a été créé offre de
nombreux avantages
34Rôle des approches par point de vue dans les
processus intensifs en connaissances
- Les approches par points de vue, ontologies
sémiotiques et points de vue subjectifs répondent
à des besoins de gestion de linformation
associés à des "activités intensives en
connaissances" dans lesquelles la diversité des
expertises mobilisées ne permet pas dobtenir de
prime abord un référentiel stable et standardisé.
- La complémentarité entre ces approches devrait
permettre de répondre à certaines des exigences
actuelles, parfois contradictoires, du record
management, de larchivistique et de la gestion
des connaissances.