Exploitation des facettes et des ontologies semiotiques pour LA GESTION DOCUMENTAIRE - PowerPoint PPT Presentation

1 / 34
About This Presentation
Title:

Exploitation des facettes et des ontologies semiotiques pour LA GESTION DOCUMENTAIRE

Description:

... responsabilit s jou s par un m me acteur (e.g. Directeur des ressources humaines) ... est essentiellement port e par un acteur, le plus souvent un expert ... – PowerPoint PPT presentation

Number of Views:101
Avg rating:3.0/5.0
Slides: 35
Provided by: mz665
Category:

less

Transcript and Presenter's Notes

Title: Exploitation des facettes et des ontologies semiotiques pour LA GESTION DOCUMENTAIRE


1
Exploitation des facettes et des ontologies
semiotiques pour LA GESTION DOCUMENTAIRE
  • Yves Marleau, président de Cogniva Information
    Solutions
  • Sabine Mas, , postdoctorante EBSI - UTT
  • Manuel Zacklad, professeur des Universités
    CNAM - UTT

2
Introduction
  • Origine de la recherche
  • Problématique de la mise en place
    dinfrastructures sémantiques unifiées - dernière
    tentative en date les ontologies
  • En France (UTT) critiques issues des recherches
    dans le domaine du Web Socio-Sémantique
  • Travaux canadiens
  • Effort pour dépasser les limitations actuelles
    outils de gestion de linformation qui sont
    souvent peu intégrés (classification, thésaurus,
    calendriers de conservation, profils de
    métadonnées)
  • Renouvellement des travaux sur la classification
    à facettes dans un contexte académique
  • Développement dans un contexte de RD
    industrielle du modèle ISIS (Integrated Semantic
    Information Services)
  • Collaboration de recherche pour faire coopérer
    approches par facettes et par points de vue.

3
De la classification hiérarchique à la
classification à facettes
4
Document et contexte de production
  • Au sein d'une organisation, un document est créé
    ou reçu dans le contexte dune fonction et la
    réalisation d'une activité administrative ou
    opérationnelle donnée.
  • Le document est défini comme l'initiateur ou la
    conséquence dun processus daffaire ou dune
    activité.
  • Afin de pouvoir témoigner de cette activité et
    assurer une meilleure interprétation,
    authenticité et valeur probante de linformation
    contenue dans ces documents, les archivistes et
    gestionnaires de documents préconisent une
    classification des documents et dossiers basée
    sur les fonctions et les activités de
    lorganisation (Conseil international des
    archives, 1997 International Standard
    Organization, 2001).

5
Difficultés dusage du schéma de classification
institutionnel
  • Vise à permettre lorganisation des documents à
    plus ou moins long terme et à faciliter leur
    localisation
  • Mais rarement utilisé par les employés qui
    privilégient des schémas de classification plus
    personnel -gt Tough Moss 2003, Mas 2007
  • Raisons
  • Terminologie trop générique
  • Pas toujours adapté à leur travail personnel
  • Difficile à mettre à jour

6
Projet de développement du méta-modèle ISIS
  • Développer une infrastructure sémantique à la
    fois commune pour les besoins duniformité de la
    gestion documentaire et flexible pour organiser
    différents types dinformation et de
    connaissance,
  • Automatiser certaines tâches de gestion de
    l'information normalement déléguées aux
    utilisateurs (e.g. automatisation du processus de
    création de métadonnées),
  • Avoir une meilleure description du contenu et du
    contexte de lobjet informationnel,
  • Relier linformation et les connaissances aux
    processus daffaires de haut niveau,
  • Utiliser un vocabulaire flexible et localisé.

7
Contexte, contenu,  dossier  ou  projet 
8
Facettes de contenu
  • Si la théorie des facettes de Ranganathan (1965)
    offre une syntaxe de base pour lexpression et la
    représentation du sujet d'un document, la liste
    des facettes de contenu ne peut être fournie a
    priori dans une formule immuable
  • elle doit plutôt être recherchée de façon
    pragmatique par un examen de la documentation
    relevant du domaine à traiter, lanalyse
    conceptuelle permettant de ramener le nombre
    théoriquement illimité des termes dun domaine à
    un nombre restreint de facettes (Vickery, 1963).
  • Une partie du contenu d'un document électronique
    peut être extraite automatiquement (e.g. auteur
    ou date de création) selon le niveau de
    structuration du document. L'autre partie est
    analysée "manuellement" (e.g. le corps du texte
    ou du message)
  • On peut toutefois s'attendre à retrouver des
    facettes de contenu fondamentales telles que
  • le Temps (e.g. Quand a eu lieu l'incident relaté
    dans le document?),
  • le Lieu (e.g. Où a eu lieu l'incident relaté dans
    le document?),
  • le Thème (e.g. Quel est le type d'incident?),
  • la Personne (e.g. Qui sont les intervenants?).
  • À ces quatre facettes peuvent s'ajouter d'autres
    dimensions suivant les besoins exprimés

9
Facettes de contenu du méta-modèle ISIS
10
Les facettes de contexte
  • Elles décrivent les liens entre le contenu d'un
    document et son environnement administratif ou
    opérationnel soit les fonctions et activités de
    gestion et dexploitation.
  • (1) Fonction, (2) Activité, (3) Type de contenu,
    (4) Rôle, (5) Poste, (6) Structure
    organisationnelle, (7) Acteur

11
Facettes de contexte du méta-modèle ISIS
12
Contexte, contenu,  dossier  ou  projet 
13
Classification dun contrat dachat
14
Relations sémantiques entre les valeurs des
facettes
  • Un des aspects les plus novateurs du métamodèle
    ISIS repose dans la création de relations
    sémantiques entre les valeurs des facettes
  • Plutôt que d'avoir des listes de termes
    indépendantes les unes des autres, les valeurs
    des facettes composant le modèle sont reliées
    sémantiquement les unes aux autres.
  • Ce faisant, on obtient un modèle qui se construit
    dynamiquement au fur et à mesure de la sélection
    des valeurs, on élimine dans les listes de termes
    proposés à l'utilisateur les valeurs non
    pertinentes, ce qui restreint le nombre de
    valeurs présentes sous chaque facette, facilite
    et accélère le processus de description et de
    classification des documents par les employés.
  • La gestion du cycle de vie des documents devient
    aussi plus transparente.
  • Par exemple, la connaissance du poste d'un
    employé (e.g. Directeur technique) qui est
    dérivée automatiquement à partir du login ou nom
    d'utilisateur entré dans le système et qui est
    associé à un acteur (e.g. John Doe) permet de
    présager des rôles (e.g. Chef de projet,
    Administrateur), des activités (e.g. Gestion des
    appels d'offres, Suivi et contrôle) qui sont
    propres à son rôle et des types de contenu (e.g.
    Contrat d'achat, Appel d'offres) reliés à ces
    activités. L'attribution automatiquement d'une
    règle de conservation devient également possible
    suite au choix des valeurs des facettes Fonction,
    Activité, Type de contenu et Thème, par exemple.

15
(No Transcript)
16
Complémentarité entre modèle à facette et modèle
par points de vue
17
Forces et faiblesses du modèle à facette
  • Envisagée dans une perspective archivistique, une
    des forces du modèle à facettes est sa stabilité
    dans le temps à léchelle de toute
    lorganisation.
  • Cependant, lobtention de cette stabilité
    implique de saccorder de manière durable sur la
    sémantique utilisée ce qui, notamment dans le
    cadre des facettes de contenu, nest pas une
    chose aisée dans un nombre important de
    professions (métier de la conception, de la RD,
    droit des affaires, marketing, etc.).
  • Pour faire face au caractère évolutif du contenu
    des documents produits dans certains secteurs
    professionnels et donc de la terminologie visant
    à refléter leur sémantique, un projet de
    recherche conjoint a été lancé entre le groupe
    socio-sémantique de lUniversité de Technologie
    de Troyes et les spécialistes de la
    classification à facettes de lUniversité de
    Montréal et de la société Cogniva.

18
Le Web Socio-Sémantique Une approche issue de
lIngénierie des connaissances
  • Le rôle de lIC
  • 1. concevoir des systèmes dorganisation des
    connaissances pour les supports documentaires
    (essentiellement associés au web)
  • 2. Faciliter lorientation dans les supports de
    connaissance ( information) dans le cadre
    dactivité denquête (conception, diagnotique,
    classification) recherche ouverte
    dinformation
  • Différentes dimensions des connaissances, métier
    (juridique, médicale, ingéniérique), sociale
    (personnes, institution), esthétique (musique,
    arts graphiques)

19
Web socio-sémantique une vision du web
différente de celle du WS
  • Vision privilégiée du Web instrument de gestion
    documentaire facilitant des transactions
    coopératives interpersonnelles éventuellement
    très asynchrones et distribuées entre des acteurs
    individuels et collectifs engagés dans des
    échanges, débats, controverses, relevant de
    domaines très variés.
  • Les modalités et les outils de gestion des
    documents doivent être pour partie conçus par les
    acteurs engagés dans une coopération active
  • Accent mis davantage sur les associations entre
    notions et la sérendipité
  • Basé une méta-sémiotique (langage) HyperTopic

20
HyperTopic trois approches de litem
Sémantique rhétorico-herméneutique thèmes
Ontologies sémiotiques (thèmes ou attributs
heuristiques)
Point de vue
Thème
Thématisation heuristique
Attributs standards
Item (sémiotique ou non)
Ressources documentaires
Spécification référentielle
Ressources
Sémantique référentielle objets et concepts
(requêtes logiques)
Documentation de litem (fouille de texte)
21
Exemple de modélisation basée sur HyperTopic
22
Facettes et points de vue
  • Les approches par facettes comme les approches
    par points de vue sont toutes deux basées sur des
    Systèmes dOrganisation des Connaissances
    multidimensionnels
  • Mais elles diffèrent par le degré de stabilité
    versus évolutivité des termes utilisés pour
    exprimer la sémantique des dimensions.
  • La problématique de la stabilité des termes
    entretient une relation étroite avec la nature de
    la sémantique sous-jacente, de type
    interprétative (ou rhétorico-herméneutique)
    versus référentielle

23
Sémantique interprétative et référentielle
  • La sémantique dun terme est référentielle quand
    il est possible de déterminer de manière non
    ambigüe si un artefact possède ou non la
    caractéristique décrite en procédant à une
    analyse de celui-ci selon une procédure
    consensuelle.
  • Par contraste, la sémantique est interprétative
    (ou rhétorico-herméneutique ), si la décision
    permettant de juger de ladéquation du terme à
    lartefact ou à la situation visée, implique de
    tenir compte du contexte (et dabord du contexte
    discursif) dans lequel ce terme est employé, des
    intentions de la personne ayant promu son usage,
    des réactions possibles des destinataires en
    fonction de leurs problématiques.

24
Les SOC selon le type de point de vue utilisé
25
Dimension commune ou singulière des dimensions
prise en compte
  • Dans le premier cas, critères communs, tous les
    acteurs sont censés appréhender les dimensions
    même sils peuvent en donner une interprétation
    particulière (consensus sur les dimensions).
  • Dans le second, un groupe dacteurs peut
    revendiquer des dimensions spécifiques qui nont
    pas à être partagées par dautres.
  • Le croisement du critère de stabilité de la
    sémantique permet de distinguer
  • les ontologies sémiotiques (points de vue
    génériques explicites),
  • les points de vue subjectifs (particuliers),
  • les facettes génériques
  • les facettes spécifiques.

26
Les SOC selon le caractère plus ou moins évolutif
et commun
27
Ontologies sémiotiques(points de vue systémiques
génériques)
  • Le recours aux ontologies sémiotiques (points de
    vue systémiques génériques) correspond aux
    situations dans lesquelles lorganisation ou la
    communauté considérée cherche à définir un
    ensemble de dimensions explicites et communes
    sans quun consensus puisse être immédiatement
    établi.
  • On parle dontologies sémiotiques pour souligner
    le fait que la communauté engagée dans la
    description vise à produire une vision du monde
    sarticulant autour de dimensions communément
    reconnues (ontologies), même lon reconnait les
    différences de points de vue liées, par exemple,
    à la profession considérée
  • Le processus de définition est progressif et il
    est même possible que lon ne parvienne jamais à
    une situation totalement stable ou que des
    périodes de crise viennent remettre en cause un
    consensus établi.
  • Mais cette vision commune sappuie pour une large
    part sur une sémantique interprétative et non
    référentielle organiser un fond dimages,
    plusieurs métiers techniques partageant des plans
    ou des documents, caractériser des pratiques de
    clients à partir de rapports, partager des
    signets de sites web, des chercheurs constituant
    une bibliothèque numérique, etc.

28
Points de vue subjectifs (développement dun
style personnel)
  • Correspond aux situations dans lesquelles une
    dimension danalyse est essentiellement portée
    par un acteur, le plus souvent un expert reconnu,
    qui représente une pratique singulière sans que
    la dimension associée à cette pratique ne soit
    nécessairement explicitée ni quelle nait
    nécessairement vocation à sinscrire dans un
    schéma densemble (par opposition avec le
    caractère "systémique" des ontologies
    sémiotiques).
  • Les points de vue subjectifs peuvent
    ultérieurement traduire un des points de vue
    systémique des ontologies sémiotiques ou rester
    propre à un expert particulier.
  • On peut également considérer des situations dans
    lesquelles le même point de vue systémique donne
    lieu à différentes déclinaisons plus
    "subjectives" invitant à considérer cette
    dimension selon différents styles (sur
    lopposition entre genre et style voir, par
    exemple, Clot, 2008).

29
Coopération entre approches par facettes et par
points de vue
30
Deux modalités possibles
  • Modalité 1 Alors que les facettes permettraient
    de traiter les dimensions stables et
    standardisées du contexte de production des
    documents et de leur contenu (e.g. lieu, temps,
    personne), les ontologies sémiotiques et les
    points de vue subjectifs seraient utilisés pour
    traiter les dimensions du contenu plus complexes
    et évolutives (e.g. thèmes, caractéristiques des
    objets décrits, usages ou finalités, voir Tableau
    4).
  • Modalité 2 les approches par points de vue
    seraient utilisées lors des phases préalables de
    lanalyse documentaire. Au fur et à mesure que la
    sémantique se stabiliserait pour la communauté
    considérée, il deviendrait possible (pour
    certaines dimensions) de passer à un mode
    représentation par facettes, dont les valeurs
    seraient plus stables et plus facilement
    combinables avec dautres facettes, par exemple,
    de contexte.

31
Opérationnalisation
  • Fédérer les infrastructures sémantiques ISIS et
    HyperTopic pour permettre de combiner les
    différents types de sémantiques associées aux
    modèles.
  • Meilleure gestion possible de la diversité des
    approches de la signification, allant des
    approches basées sur la mesure et les conventions
    administratives univoques aux approches recourant
    à des processus interprétatifs divers et
    créatifs.

32
Conclusion
33
Supériorité des approches par facettes par
rapport au paradigme hiérarchique
  • L'exploitation des facettes constitue une
    solution alternative très riche au paradigme
    hiérarchique pour lorganisation documentaire au
    sein des entreprises.
  • Les études et expériences présentement réalisées
    au sein de plusieurs organisations publiques
    canadiennes (e.g. Bibliothèque et Archives
    Canada, Développement Économique Canada) semblent
    indiquer que la souplesse, lexpressivité et la
    simplicité du métamodèle à facettes ISIS, mettant
    en relation le contenu thématique d'un document
    et le contexte dans lequel il a été créé offre de
    nombreux avantages

34
Rôle des approches par point de vue dans les
processus intensifs en connaissances
  • Les approches par points de vue, ontologies
    sémiotiques et points de vue subjectifs répondent
    à des besoins de gestion de linformation
    associés à des "activités intensives en
    connaissances" dans lesquelles la diversité des
    expertises mobilisées ne permet pas dobtenir de
    prime abord un référentiel stable et standardisé.
  • La complémentarité entre ces approches devrait
    permettre de répondre à certaines des exigences
    actuelles, parfois contradictoires, du record
    management, de larchivistique et de la gestion
    des connaissances.
Write a Comment
User Comments (0)
About PowerShow.com