Etude exploratoire des pratiques d - PowerPoint PPT Presentation

1 / 34
About This Presentation
Title:

Etude exploratoire des pratiques d

Description:

Etude exploratoire des pratiques d indexation sociale comme une ren gociation des espaces documentaires. Observations D rive des continents documentaires . – PowerPoint PPT presentation

Number of Views:113
Avg rating:3.0/5.0
Slides: 35
Provided by: Urf61
Category:

less

Transcript and Presenter's Notes

Title: Etude exploratoire des pratiques d


1
Etude exploratoire des pratiques dindexation
sociale
comme une renégociation des espaces
documentaires.
2
Olivier Ertzscheid. Maître de Conférences.
Université de Nantes. IUT de la Roche sur Yon.
Equipe CREC. Laboratoire DOCSI (Université de
Lyon). www.affordance.info
Conférence DocSocDocument numérique et
sociétéFribourg / 20-21 Septembre 2006
Gabriel Gallezot. Maître de Conférences Université
de Nice - Sophia Antipolis Urfist PacaC.
Laboratoire I3M (EA 3820) www.urfist.info.
3
Observations
Economie  sociale  des documents numériques
Massification/marchandisation des accès
  •  Indexation sociale  / Folksonomies
  • Impactent durablement les pratiques dIR (accès,
    représentation, recherche, navigation)
  • Contexte redocumentarisation caractériser
    documents  tertiaires 
  • Posent la question dune transition vers web
    (socio-)sémantique.

Communautarisation des pratiques
Hétérogénéité des contenus
4
Dérive des continents  documentaires .
indexé
non-indexé
2015 ?
2005
Web public
Quoi ?
Web personnel (Desktop)
Web intime (Mail)
Web privé
1995
5
Tectonique documentaire
  •  Eclaire  communautarisation des pratiques
  •  Correspond 
  • Nouvelle échelle, nouveaux formats, nouvelles
    volumétries
  • Acculturation aux outils et aux pratiques de
    marchandisation des accès
  • Processus global de redocumentarisation
  •  Comme dans la précédente modernisation, le
    document participe au processus et même y joue un
    rôle clé, mais il sest transformé au point que
    lon peut se demander sil sagit encore de la
    même entité 
  • Archive foucaldienne
  •  Par archive, jentends dabord la masse des
    choses dites dans une culture, conservées,
    valorisées, réutilisées, répétées et
    transformées. Bref toute cette masse verbale qui
    a été fabriquée par les hommes, investie dans
    leurs techniques et leurs institutions, et qui
    est tissée avec leur existence et leur histoire 
  • Hypothèse émergence dune  indexation
    sociale  correspond au besoin de traitement,
    dappropriation, de partage, de mise en
    représentation de ces nouvelles configurations
    informationnelles.

6
Définition
  •  Folksonomies désignent
  • un processus de classification collaborative
  • par des mots-clés librement choisis
  • Ou le résultat de cette classification. 
    (Wikipédia)

7
? thesaurus
  •  vocabulaire normalisé sur la base de termes
    génériques et de termes spécifiques à un
    domaine 

8
? ontologie
  •  ensemble structuré de concepts. ()
  • organisés dans un graphe ()
  • relations sémantiques et de composition ou
    d'héritage. 

9
4 écoles dindexation Web
Standardisation
Full-text gt Balises Méta gt Métadonnées
  • Standardisation
  • gt Dublin Core
  • gt OAI-PMH
  • Folksonomies
  • indexation sociale
  • communautaire

Linguistique de corpus
?
  • Ontologies
  • (Ingénierie des
  • connaissances)
  • Web
  • Sémantique

?
10
Folksonomie ? thesaurus ? ontologie
  •  Folksonomies désignent
  • un processus de classification collaborative
  • par des mots-clés librement choisis
  • Ou le résultat de cette classification. 
  • Vocabulaire non-normalisé,
  • non-structuré,
  • non-spécifique à un domaine,
  • sans relations sémantiques ou hiérarchiques.

11
? Avantages Inconvénients ?
  • Point de vue de lInformation Retrieval
  • En amont
  • Indexation humaine, à la volée, instantanée,
    cumulative
  • Facile / Rapide /
  • En aval
  • filtrage collaboratif (communautaire -
    del.icio.us, connotea - , thématique - technorati
    - orienté-support - flickR - )
  • Avantages  de surface 
  • Simplicité, Rapidité,
  • Coût 0 ltgt Expertise 0,
  • Tous types dobjets (documents, livres, photos,
    couriels ) FLickR http//www.flickr.com/map/
    )
  • Adéquation aux usages / pratiques de lIR
    (onebox, oneword)

12
? Avantages Inconvénients ?
  • Inconvénients les mêmes
  • Trop simple, trop peu coûteux, trop peu
    dexpertise, trop dhétérogénéité
  • Confusion entretenue (IR) entre pertinence
    (autorité) et popularité (photos les plus vues
    les plus tagguées et réciproquement)
  • polysémie, synonymie, lemmatisation, orthographe,
    langue, redondance, univers de référence
    ( peinture  et/ou  louvre , etc.)
  • ET POURTANT

13
ça marche !
  • Ya-t-il un intérêt ?
  • Du point de vue des utilisateurs ?
  • OUI. Adhésion massive. Généralisation des
    pratiques.
  • Du point de vue de lhétérogénéité et de la masse
    des corpus décrits ?
  • OUI. Efficace sinon pertinent (empiriquement
    théorie évoquée plus loin)
  • Du point de vue de la facilitation et/ou de
    nouvelles modalités du processus dIR ?
  • OUI. Sérendipité.
  • Adhésion utilisateurs, gain de temps, gain
    déchelle, économie dexpertise
  • gt Pourquoi ? Pérennité des pratiques ?

14
3 modèles  inadaptés 
  • Standardisation
  • gt Dublin Core
  • gt OAI-PMH

Full-text gt Balises Méta gt Métadonnées
  • Ontologies
  • (Ingénierie des
  • connaissances)
  • Au regard des nouveaux continents documentaires
    du web.
  • Web ( contenus indexables) oxymorique
  • Homogénéité des processus (tout est lié à tout -
    ou peut lêtre)
  • Hétérogénéité des contenus, des éléments liés
    (mail, photos de vacances, textes, sites,
    signets, etc.)
  • Finalité (religion ?) de laccès
  • Accès au document. Accès au partage. Accès à une
    communauté.
  • Gratuit. Instantané.

15
Finalité de laccès et bibliothéconomie de masse.
  • Bibliothéconomie de masse
  • quel modèle ? Marchand ? Raisonné ?
  • Quelles logiques qualitatives ? Quantitatives ?
  • Librarything (5 millions douvrages)
  • Indexation  standard  notice au format MARC,
    indexation DEWEY, LC "subjects headings ,
  • indexation sociale des tags associés, des
    fiches de lecture et revues de la communauté,
    système de recommandation
  • http//www.librarything.com

16
Science et folksonomies
  • Interface
  • Bibliothèque Catalogue http//tags.library.upenn
    .edu/
  • communautaire scientifique (www.postgenomic.com)
  • Partage de signets (del.icio.us, connotea)
  • Les 2 écoles ou le meilleur des deux mondes.
  • Interface BdD (http//www.hubmed.org)

17
Science et folksonomies
18
? Approches complémentaires ?
  • Construire des ontologies  sur  des
    folksonomies ?
  • Folksonomies
  • indexation sociale
  • communautaire

?
  • Ontologies
  • (Ingénierie des
  • connaissances)
  • Web
  • Socio-
  • Sémantique

?
19
Folksonomies et moteurs (IR)
  • Illustration de la  puissance dinterface 
  • Tagnautica
  • http//www.quasimondo.com/tagnautica.php
  • Héritage de la linguistique de corpus
  • http//aixtal.blogspot.com/2006/01/outil-le-nbulos
    cope.html
  • Moteurs dédiés (technorati)
  • Fonctionalité intégrée (MyYahoo)

20
Folksonomies et IR
  • Interfaçage  idéal  de tous types de requêtage
  • Requêtes informationnelles
  • Information  précise  ou dédiée.
  • Requêtes transactionnelles
  • Réserver un billet davion.
  • Requêtes navigationnelles
  • Vue densemble (cartographie, clusters)
  • Requêtes  interactionnelles 
  •  Search partys , social bookmarking, tagging

Le mot contre son absence
21
Les raisons du succès (1/5) Une temporalité
(ré?)unifiée entre interface et indexation
  • Temps consultation temps de laccès temps de
    lindexation
  • Micro-temporalités successives, parfois
    simultanées, jamais contraintes, sans préalables.
  • Langages documentaires formels (Thésaurus
    ontologies) pour laccès à linformation
  • Interfaces asynchrones.
  • Nbre textes gt nbre dindexeur temporalité
    interfaçage longue
  • acculturation à rebours (des novices vers
    lexpert)
  • Folksonomies
  • Interface synchrone. Le temps de lindexation est
    le même que celui de laccès et du repérage.
  • Nbre documents lt nbre dindexeurs temporalité
    interfaçage courte (simultanée)
  • Acculturation a priori.

22
Les raisons du succès (2/5) La fonction
symbolique plutôt que la vocation analytique.
  • Vocation analytique des langages documentaires
    formels
  • classer physiquement et/ou conceptuellement selon
    la nature de lobjet
  • Univers de référence  construit  par
    lindexeur, lexpert et létat des connaissances
    au moment de lindexation
  • Approche  objective , logique ou logiciste
  • Fonction symbolique Folksonomies
  • repérer spatialement et/ou sémantiquement pour
    accéder et/ou représenter lobjet.
  • Univers de référence induit par lobjet lui-même
    et le rapport objet/indexeur
  • Approche  subjective , empirique,  essai et
    erreur 

23
Les raisons du succès (3/5) la sagesse des
foules
  •  () N'importe qui peut déposer n'importe quel
    tag sur n'importe quelle photo. Mais - et c'est
    la clé - Flickr offre un retour sur les tags les
    plus utilisés et les plus populaires, et les gens
    souhaitant attirer l'attention sur leurs photos
    (...) apprennent rapidement à utiliser ce lexique
    si celui-ci fait sens. Cela rend le système
    étonnamment stable. Del.icio.us fait la même
    chose. Le succès de Google pour rendre les
    recherches plus pertinentes reposait sur la
    puissance de cette sagesse populaire
    (PageRank)...  Adam Bosworth, VP ingénierie chez
    Google.
  • Postule lexistence pour tout élément donné
    (texte, image, document) dune série de mots et
    termes composant le plus petit lexique commun
    (concensus) permettant de décrire l'objet ou le
    document.

24
Les raisons du succès (4/5) un faible coût
cognitif
  • Marquage élimine la phase de décision (choix de
    la bonne catégorie)
  • Dissipe la phase de paralysie danalyse (choix du
    mot-clé)
  • Permet lancrage en contexte socio-cognitif
    immédiat.
  • Google image labeller http//images.google.com/i
    magelabeler/
  • Hiérarchie centrée document VS anarchie centrée
    utilisateur MAIS
  • Confirmation de laxiomatique du memex
  •  human mind doesnt work that way 
  •  association 
  • Emergence de patterns stables et auto-régulés

25
Les raisons du succès (5/5) Auto-régulation ?
  • Golder Scott A. Huberman Bernardo A.,  The
    Structure of Collaborative Tagging Systems ,
    Information Dynamics Lab, HP Labs , 2005.
  • Méthodologie
  • Site Del.icio.us
  • Sur une période donnée (5 jours)
  • Corpus
  • Les plus populaires (212 URL présents dans 19422
    signets)
  • Échantillon aléatoire de 229 usagers ayant
    partagé durant période test tous leurs signets
    y compris hors-période (68 668 signets)

26
Auto-régulation ?
  • Résultats
  • 7 types de tags
  • Thématiques (orientés sujet) /
  • Nature de lobjet (article, blog, livre) /
  • Propriétaire (auteur du signet) /
  • adjectifs de caractérisation (drôle, stupide,
    horreur) /
  • auto-référence (messignets, monnom ) /
  • orientés tâche (à lire, recherche demploi)
  • Plus on possède ( partage), plus on taggue
  • (avec fortes variations selon individus)
  • Motifs stables dans la proportion et le choix des
    tags.
  • Plus une ressource est partagée, plus le nombre
    de tags la décrivant se stabilise ainsi que leur
    nature.
  • Subjectivation des adjectifs de caractérisation
    savère pertinente du fait de son inscription
    dans une communauté.

27
Documents primaires, secondaires TERTIAIRES
  • Un document  tertiaire  est porteur dune
    triple hybridation
  • Mécanismes dinscription ET de navigation
  • Synchronicité des temporalités de repérage,
    danalyse ET daccès
  • Babélisation des pratiques expertes (indexation),
    individuelles (tagging) ET communautaires
    (filtrage)
  • Continent documentaire  unifié  (usages)
  • Force tectonique indexabilité.
  • Folksonomies
  • creuset de nouvelles pratiques sociales du
    document.
  • Impact durable (à étudier) sur pratiques dIR

28
Folksonomies comme
  •  ontologies sémiotiques  ?
  •  acteurs divers
  • compétences hétérogènes impliquant recours à des
    classifications partagées par le collectif
  • et représentées explicitement dans linterface du
    système . (Zacklad)
  • Partie usages émergés web socio-sémantique
  •  codétermination des usages informationnels et
    communicationnels  (Zacklad)
  •  à lintérieur de communautés de pratique 

29
MeRci
? QuEsTioNs ?
? QuEsTioNs ?
30
Confusion des pratiques informationnelles
31
Question dindexabilité
  • Réunion dUnivers informationnels distincts
  • Questionnent lindexabilité de cette  masse 
    selon troix axes/modèles
  • Bibliothéconomique. Gestion et accès raisonné
    des/aux contenus.
  • Marchand (prime à laccès. Ex. de Google books)
  • Communautaire et à la volée indexation sociale.
  • Copie nuage de tags sur le meur ou autre, sur mon
    blog, del.icio.us.

32
  • PERONOMIES Kekseksa ? Le dernier de ces
    néologismes dont le web 2.0 est friand. Dans la
    lignée (inverse) des folksonomies, les
    personomies se définissent comme "mon
    environnement informationnel personnel. C'est
    l'environnement informationnel que j'ai construit
    dans le temps (...) et qui inclue mes contacts,
    mes achats, mes historiques de recherche, mes
    emails, mes fils rss, mes commentaires sur les
    blogs, etc ... 
  • Nota Bene de 10 minutes plus tard la socionomie
    n'est pas seulement un synonyme de "folksonomie"
    ou de "potonomie", elle est une théorie
    scientifique qui intégre "une nouvelle approche
    de l'économie politique en intégrant le
    comportement des agents économiques et la
    psychologie de masse.", comme l'indique la seule
    publication francophone dénichée sur le sujet.
    Mais il en est sûrement d'autres et des
    meilleures que vous aurez l'obligeance de me
    signaler en commentaires -)
  • En tout cas et sous-réserve d'approfondissement,
    il se pourrait bien que cette socionomie là soit
    le champ de recherche encadrant idéalement
    l'ensemble des études sur les moteurs de
    recherche et leurs implications cognitives et
    sociétales. Et hop, une chaire de socionomie !
    Comme un écho à celle d'intelligence collective
    initiée par Pierre Lévy.

33
Avantages folkso
  • Taux de rappel (TR) nombre de documents
    pertinents retournés divisé par le nombre de
    documents pertinents existants.
  • Taux de précision (TP) nombre de documents
    pertinents retournés divisé par le nombre de
    documents retournés.
  • Mesures non adaptées
  • nature des corpus (sites dactualité, taguage
    uniforme  11 Septembre ). Taux de
    recouvrement non-mesurable entre sites
    communautaires tags sous del.icio.us, ne sont
    pas tags sous technorati ou sous MyYahoo!, et
    documents sont également différents.
  • Juger de la pertinence des folksonomies dans un
    processus dIR réclamerait lajout de nouvelles
    métriques
  • Taux de partage (nbre de doc. Pertinents par
    rapports aux nobre de documents partagés)
  • Taux de partage optimal (nbre de doc. Pertinents
    par rapports aux nombre de documents les plus
    partagés)

34
  • Les trois âges documentaires
  • Web 0 ce qui est publié (navigateurs)
  • Web 1.0 ce qui est accédé (moteurs) ou indexé
    pour être accédé. Ceux qui indexent (bots)
    nétant pas ceux qui accèdent (users)
  • Web 2.0 ce qui est indexé pour être accédé
    pour/par/dans une communauté dusagers-indexeurs.
Write a Comment
User Comments (0)
About PowerShow.com