Title: Etude exploratoire des pratiques d
1Etude exploratoire des pratiques dindexation
sociale
comme une renégociation des espaces
documentaires.
2Olivier Ertzscheid. Maître de Conférences.
Université de Nantes. IUT de la Roche sur Yon.
Equipe CREC. Laboratoire DOCSI (Université de
Lyon). www.affordance.info
Conférence DocSocDocument numérique et
sociétéFribourg / 20-21 Septembre 2006
Gabriel Gallezot. Maître de Conférences Université
de Nice - Sophia Antipolis Urfist PacaC.
Laboratoire I3M (EA 3820) www.urfist.info.
3Observations
Economie sociale des documents numériques
Massification/marchandisation des accès
- Indexation sociale / Folksonomies
- Impactent durablement les pratiques dIR (accès,
représentation, recherche, navigation) - Contexte redocumentarisation caractériser
documents tertiaires - Posent la question dune transition vers web
(socio-)sémantique.
Communautarisation des pratiques
Hétérogénéité des contenus
4Dérive des continents documentaires .
indexé
non-indexé
2015 ?
2005
Web public
Quoi ?
Web personnel (Desktop)
Web intime (Mail)
Web privé
1995
5Tectonique documentaire
- Eclaire communautarisation des pratiques
- Correspond
- Nouvelle échelle, nouveaux formats, nouvelles
volumétries - Acculturation aux outils et aux pratiques de
marchandisation des accès - Processus global de redocumentarisation
- Comme dans la précédente modernisation, le
document participe au processus et même y joue un
rôle clé, mais il sest transformé au point que
lon peut se demander sil sagit encore de la
même entité - Archive foucaldienne
- Par archive, jentends dabord la masse des
choses dites dans une culture, conservées,
valorisées, réutilisées, répétées et
transformées. Bref toute cette masse verbale qui
a été fabriquée par les hommes, investie dans
leurs techniques et leurs institutions, et qui
est tissée avec leur existence et leur histoire - Hypothèse émergence dune indexation
sociale correspond au besoin de traitement,
dappropriation, de partage, de mise en
représentation de ces nouvelles configurations
informationnelles.
6Définition
- Folksonomies désignent
- un processus de classification collaborative
- par des mots-clés librement choisis
- Ou le résultat de cette classification.
(Wikipédia)
7? thesaurus
- vocabulaire normalisé sur la base de termes
génériques et de termes spécifiques à un
domaine
8? ontologie
- ensemble structuré de concepts. ()
- organisés dans un graphe ()
- relations sémantiques et de composition ou
d'héritage.
94 écoles dindexation Web
Standardisation
Full-text gt Balises Méta gt Métadonnées
- Standardisation
- gt Dublin Core
- gt OAI-PMH
- Folksonomies
- indexation sociale
- communautaire
Linguistique de corpus
?
- Ontologies
- (Ingénierie des
- connaissances)
?
10Folksonomie ? thesaurus ? ontologie
- Folksonomies désignent
- un processus de classification collaborative
- par des mots-clés librement choisis
- Ou le résultat de cette classification.
- Vocabulaire non-normalisé,
- non-structuré,
- non-spécifique à un domaine,
- sans relations sémantiques ou hiérarchiques.
11 ? Avantages Inconvénients ?
- Point de vue de lInformation Retrieval
- En amont
- Indexation humaine, à la volée, instantanée,
cumulative - Facile / Rapide /
- En aval
- filtrage collaboratif (communautaire -
del.icio.us, connotea - , thématique - technorati
- orienté-support - flickR - )
- Avantages de surface
- Simplicité, Rapidité,
- Coût 0 ltgt Expertise 0,
- Tous types dobjets (documents, livres, photos,
couriels ) FLickR http//www.flickr.com/map/
) - Adéquation aux usages / pratiques de lIR
(onebox, oneword)
12 ? Avantages Inconvénients ?
- Inconvénients les mêmes
- Trop simple, trop peu coûteux, trop peu
dexpertise, trop dhétérogénéité -
- Confusion entretenue (IR) entre pertinence
(autorité) et popularité (photos les plus vues
les plus tagguées et réciproquement) - polysémie, synonymie, lemmatisation, orthographe,
langue, redondance, univers de référence
( peinture et/ou louvre , etc.) - ET POURTANT
13 ça marche !
- Ya-t-il un intérêt ?
- Du point de vue des utilisateurs ?
- OUI. Adhésion massive. Généralisation des
pratiques. - Du point de vue de lhétérogénéité et de la masse
des corpus décrits ? - OUI. Efficace sinon pertinent (empiriquement
théorie évoquée plus loin) - Du point de vue de la facilitation et/ou de
nouvelles modalités du processus dIR ? - OUI. Sérendipité.
- Adhésion utilisateurs, gain de temps, gain
déchelle, économie dexpertise - gt Pourquoi ? Pérennité des pratiques ?
143 modèles inadaptés
- Standardisation
- gt Dublin Core
- gt OAI-PMH
Full-text gt Balises Méta gt Métadonnées
- Ontologies
- (Ingénierie des
- connaissances)
- Au regard des nouveaux continents documentaires
du web. - Web ( contenus indexables) oxymorique
- Homogénéité des processus (tout est lié à tout -
ou peut lêtre) - Hétérogénéité des contenus, des éléments liés
(mail, photos de vacances, textes, sites,
signets, etc.) - Finalité (religion ?) de laccès
- Accès au document. Accès au partage. Accès à une
communauté. - Gratuit. Instantané.
15Finalité de laccès et bibliothéconomie de masse.
- Bibliothéconomie de masse
- quel modèle ? Marchand ? Raisonné ?
- Quelles logiques qualitatives ? Quantitatives ?
- Librarything (5 millions douvrages)
- Indexation standard notice au format MARC,
indexation DEWEY, LC "subjects headings , - indexation sociale des tags associés, des
fiches de lecture et revues de la communauté,
système de recommandation - http//www.librarything.com
16Science et folksonomies
- Interface
- Bibliothèque Catalogue http//tags.library.upenn
.edu/ - communautaire scientifique (www.postgenomic.com)
- Partage de signets (del.icio.us, connotea)
- Les 2 écoles ou le meilleur des deux mondes.
- Interface BdD (http//www.hubmed.org)
17Science et folksonomies
18? Approches complémentaires ?
- Construire des ontologies sur des
folksonomies ?
- Folksonomies
- indexation sociale
- communautaire
?
- Ontologies
- (Ingénierie des
- connaissances)
?
19Folksonomies et moteurs (IR)
- Illustration de la puissance dinterface
- Tagnautica
- http//www.quasimondo.com/tagnautica.php
- Héritage de la linguistique de corpus
- http//aixtal.blogspot.com/2006/01/outil-le-nbulos
cope.html - Moteurs dédiés (technorati)
- Fonctionalité intégrée (MyYahoo)
20Folksonomies et IR
- Interfaçage idéal de tous types de requêtage
- Requêtes informationnelles
- Information précise ou dédiée.
- Requêtes transactionnelles
- Réserver un billet davion.
- Requêtes navigationnelles
- Vue densemble (cartographie, clusters)
- Requêtes interactionnelles
- Search partys , social bookmarking, tagging
Le mot contre son absence
21Les raisons du succès (1/5) Une temporalité
(ré?)unifiée entre interface et indexation
- Temps consultation temps de laccès temps de
lindexation - Micro-temporalités successives, parfois
simultanées, jamais contraintes, sans préalables.
- Langages documentaires formels (Thésaurus
ontologies) pour laccès à linformation - Interfaces asynchrones.
- Nbre textes gt nbre dindexeur temporalité
interfaçage longue - acculturation à rebours (des novices vers
lexpert)
- Folksonomies
- Interface synchrone. Le temps de lindexation est
le même que celui de laccès et du repérage. - Nbre documents lt nbre dindexeurs temporalité
interfaçage courte (simultanée) - Acculturation a priori.
22Les raisons du succès (2/5) La fonction
symbolique plutôt que la vocation analytique.
- Vocation analytique des langages documentaires
formels - classer physiquement et/ou conceptuellement selon
la nature de lobjet - Univers de référence construit par
lindexeur, lexpert et létat des connaissances
au moment de lindexation - Approche objective , logique ou logiciste
- Fonction symbolique Folksonomies
- repérer spatialement et/ou sémantiquement pour
accéder et/ou représenter lobjet. - Univers de référence induit par lobjet lui-même
et le rapport objet/indexeur - Approche subjective , empirique, essai et
erreur
23Les raisons du succès (3/5) la sagesse des
foules
- () N'importe qui peut déposer n'importe quel
tag sur n'importe quelle photo. Mais - et c'est
la clé - Flickr offre un retour sur les tags les
plus utilisés et les plus populaires, et les gens
souhaitant attirer l'attention sur leurs photos
(...) apprennent rapidement à utiliser ce lexique
si celui-ci fait sens. Cela rend le système
étonnamment stable. Del.icio.us fait la même
chose. Le succès de Google pour rendre les
recherches plus pertinentes reposait sur la
puissance de cette sagesse populaire
(PageRank)... Adam Bosworth, VP ingénierie chez
Google.
- Postule lexistence pour tout élément donné
(texte, image, document) dune série de mots et
termes composant le plus petit lexique commun
(concensus) permettant de décrire l'objet ou le
document.
24Les raisons du succès (4/5) un faible coût
cognitif
- Marquage élimine la phase de décision (choix de
la bonne catégorie) - Dissipe la phase de paralysie danalyse (choix du
mot-clé) - Permet lancrage en contexte socio-cognitif
immédiat. - Google image labeller http//images.google.com/i
magelabeler/
- Hiérarchie centrée document VS anarchie centrée
utilisateur MAIS - Confirmation de laxiomatique du memex
- human mind doesnt work that way
- association
- Emergence de patterns stables et auto-régulés
25Les raisons du succès (5/5) Auto-régulation ?
- Golder Scott A. Huberman Bernardo A., The
Structure of Collaborative Tagging Systems ,
Information Dynamics Lab, HP Labs , 2005. - Méthodologie
- Site Del.icio.us
- Sur une période donnée (5 jours)
- Corpus
- Les plus populaires (212 URL présents dans 19422
signets) - Échantillon aléatoire de 229 usagers ayant
partagé durant période test tous leurs signets
y compris hors-période (68 668 signets)
26Auto-régulation ?
- Résultats
- 7 types de tags
- Thématiques (orientés sujet) /
- Nature de lobjet (article, blog, livre) /
- Propriétaire (auteur du signet) /
- adjectifs de caractérisation (drôle, stupide,
horreur) / - auto-référence (messignets, monnom ) /
- orientés tâche (à lire, recherche demploi)
- Plus on possède ( partage), plus on taggue
- (avec fortes variations selon individus)
- Motifs stables dans la proportion et le choix des
tags. - Plus une ressource est partagée, plus le nombre
de tags la décrivant se stabilise ainsi que leur
nature. - Subjectivation des adjectifs de caractérisation
savère pertinente du fait de son inscription
dans une communauté.
27Documents primaires, secondaires TERTIAIRES
- Un document tertiaire est porteur dune
triple hybridation - Mécanismes dinscription ET de navigation
- Synchronicité des temporalités de repérage,
danalyse ET daccès - Babélisation des pratiques expertes (indexation),
individuelles (tagging) ET communautaires
(filtrage) - Continent documentaire unifié (usages)
- Force tectonique indexabilité.
- Folksonomies
- creuset de nouvelles pratiques sociales du
document. - Impact durable (à étudier) sur pratiques dIR
28Folksonomies comme
- ontologies sémiotiques ?
- acteurs divers
- compétences hétérogènes impliquant recours à des
classifications partagées par le collectif - et représentées explicitement dans linterface du
système . (Zacklad) - Partie usages émergés web socio-sémantique
- codétermination des usages informationnels et
communicationnels (Zacklad) - à lintérieur de communautés de pratique
29 MeRci
? QuEsTioNs ?
? QuEsTioNs ?
30Confusion des pratiques informationnelles
31Question dindexabilité
- Réunion dUnivers informationnels distincts
- Questionnent lindexabilité de cette masse
selon troix axes/modèles - Bibliothéconomique. Gestion et accès raisonné
des/aux contenus. - Marchand (prime à laccès. Ex. de Google books)
- Communautaire et à la volée indexation sociale.
- Copie nuage de tags sur le meur ou autre, sur mon
blog, del.icio.us.
32- PERONOMIES Kekseksa ? Le dernier de ces
néologismes dont le web 2.0 est friand. Dans la
lignée (inverse) des folksonomies, les
personomies se définissent comme "mon
environnement informationnel personnel. C'est
l'environnement informationnel que j'ai construit
dans le temps (...) et qui inclue mes contacts,
mes achats, mes historiques de recherche, mes
emails, mes fils rss, mes commentaires sur les
blogs, etc ... - Nota Bene de 10 minutes plus tard la socionomie
n'est pas seulement un synonyme de "folksonomie"
ou de "potonomie", elle est une théorie
scientifique qui intégre "une nouvelle approche
de l'économie politique en intégrant le
comportement des agents économiques et la
psychologie de masse.", comme l'indique la seule
publication francophone dénichée sur le sujet.
Mais il en est sûrement d'autres et des
meilleures que vous aurez l'obligeance de me
signaler en commentaires -) - En tout cas et sous-réserve d'approfondissement,
il se pourrait bien que cette socionomie là soit
le champ de recherche encadrant idéalement
l'ensemble des études sur les moteurs de
recherche et leurs implications cognitives et
sociétales. Et hop, une chaire de socionomie !
Comme un écho à celle d'intelligence collective
initiée par Pierre Lévy.
33Avantages folkso
- Taux de rappel (TR) nombre de documents
pertinents retournés divisé par le nombre de
documents pertinents existants. - Taux de précision (TP) nombre de documents
pertinents retournés divisé par le nombre de
documents retournés. - Mesures non adaptées
- nature des corpus (sites dactualité, taguage
uniforme 11 Septembre ). Taux de
recouvrement non-mesurable entre sites
communautaires tags sous del.icio.us, ne sont
pas tags sous technorati ou sous MyYahoo!, et
documents sont également différents. - Juger de la pertinence des folksonomies dans un
processus dIR réclamerait lajout de nouvelles
métriques - Taux de partage (nbre de doc. Pertinents par
rapports aux nobre de documents partagés) - Taux de partage optimal (nbre de doc. Pertinents
par rapports aux nombre de documents les plus
partagés)
34- Les trois âges documentaires
- Web 0 ce qui est publié (navigateurs)
- Web 1.0 ce qui est accédé (moteurs) ou indexé
pour être accédé. Ceux qui indexent (bots)
nétant pas ceux qui accèdent (users) - Web 2.0 ce qui est indexé pour être accédé
pour/par/dans une communauté dusagers-indexeurs.