Recherche d'Information Gabriel Gallezot Universit - PowerPoint PPT Presentation

1 / 42
About This Presentation
Title:

Recherche d'Information Gabriel Gallezot Universit

Description:

Recherche d'Information Gabriel Gallezot Universit de Nice Sophia Antipolis URFIST gallezot_at_unice.fr – PowerPoint PPT presentation

Number of Views:215
Avg rating:3.0/5.0
Slides: 43
Provided by: gg94
Category:

less

Transcript and Presenter's Notes

Title: Recherche d'Information Gabriel Gallezot Universit


1
Recherche d'InformationGabriel
GallezotUniversité de Nice Sophia
AntipolisURFISTgallezot_at_unice.fr
2
Imaginez la situation suivante
Intro
  • Vous êtes actuellement chercheur dans un labo. En
    vue de la réalisation d'un prochain projet, le
    responsable du labo vous demande
  • De produire une bibliographie sur de le thème de
    l'anthropocene
  • De lui fournir sur la base de la bibliographie
    réalisée une dizaine de documents significatifs
    afin de mieux cerner ce thème.
  • De surveiller un certain nombre de sites sur ce
    même thème et d'être attentif à l'image de
    l'organisme sur le web.
  • De lui proposer un moyen simple de partager des
    références (liens sur textes ou sites) avec les
    autres membres du projet de recherche qui
    travaillent sur d'autres thèmes connexes.

Pull
Push
3
Plan
  1. Introduction générale à la recherche
    dinformation
  2. Outils de recherche
  3. En Bu
  4. Sur le web
  5. Mon environnement de travail
  6. Methode Push

4
1Introduction générale à la recherche
dinformation
5
  •  Lécriture nous a permis d externaliser en
    partie notre mémoire.
  • Limprimerie nous a permis de transmettre cette
    mémoire externe.
  • La Toile a diminué considérablement les coûts de
    transmission de linformation. 
  • Surtout, elle a permis à chacun dapporter sa
    contribution personnelle au patrimoine collectif
  • ABITEBOUL, Serge. Sciences des données de la
    logique du premier ordre à la Toile. Nouvelle
    édition en ligne. Paris Collège de France,
    2012. Disponible sur Internet
    lthttp//books.openedition.org/cdf/506gt.

6
Données, informations, connaissances et document
  • Une donnée est une description élémentaire,
    typiquement numérique pour nous, dune réalité.
    Cest par exemple une observation ou une mesure.
  • À partir de données collectées, de linformation
    est obtenue en organisant ces données, en les
    structurant pour en dégager du sens.
  • En comprenant le sens de linformation, nous
    aboutissons à des connaissances, cest-à-dire à
    des faits considérés comme vrais dans
    lunivers dun locuteur, et à des lois (des
    règles logiques) de cet univers.
  • "Toute connaissance mémorisée, stockée sur un
    support, fixée par l'écriture ou inscrite par un
    moyen mécanique, physique, chimique,
    électronique, constitue un document. ... tant
    que le document est créé mais n'est pas encore
    utilisé par un récepteur, il reste un document
    virtuel. Dès lors qu'il est employé et décodé par
    un récepteur, le document devient réel il a
    trouvé son utilisateur" (voir dia    la
    tridimensionnalité du document )

ABITEBOUL, Serge. Sciences des données de la
logique du premier ordre à la Toile. Nouvelle
édition en ligne. Paris Collège de France,
2012. Disponible sur Internet
lthttp//books.openedition.org/cdf/5 ESTIVAL
(Robert), MEYRIAT (Jean).- "La dialectique de
l'écrit et du document. Un effort de synthèse".-
in Schéma et schématisation, nº14, 2e trim.
1981.- p.82-91.06gt.
7
Tridimensionnalité du document
  • Pédauque R-T, Salaün J-M. Le document à la
    lumière du numérique. CF Editions 2006.

Signe ou forme
Ou repéré
document support inscription Document est
une promesse
Texte ou contenu
 contrat de lecture
Ou retenu
Ou compris
Médium ou relation
document objet mémoriel 
Le document est une trace permettant
dinterpréter un événement passé à partir dun
contrat de lecture cest une construction
sociale , le vu (la trace, laspect matériel),
le lu (linterprétation, la dimension
intellectuelle) et le su (la dimension mémorielle
de lévénement)
8
L'accès à l'information
Invariant -)
Source  C. Fauré
  • Les "techniques intellectuelles" sont des
    méthodes et des outils ayant la capacité de
    repérer et de retrouver l'information 

9
Repérage / indexation de d'information
  • Référents externes
  • Liste
  • Taxinomie
  • Thésaurus 
  • Ontologie (graph)
  • Référents internes
  • métadonnées
  • structures

10
taxinomie / thésaurus / ontologie
11
Index
  • Le principe de stockage des informations dans
    l'index est celui d'un annuaire inversé
  • Chaque terme est associé a une liste de documents
    y contenant une occurrence -gt critère de rapidité
    de recherche
  • L'index stocke les informations sur les sources
    dans un format pivot La richesse de ce format
    pivot, qui structure l'index, va être garante de
    la qualité de recherche.

Source  C. Fauré
12
Répères pour appréhender le Web
  • 1991 (public) Tim Berners-Lee et Robert Cailliau
  • Système métastable (métaphore du rocher),
    distribué et ouvert
  • Pb du web  croissance rapide, création de
    désorientation du web classique gt proposition
    d'un web sémantique (web de données) en 1994.
  • Autres solutions en attendant le web de données
  • Les moteurs
  • Web 2.0
  • réseaux sociaux
  • API (Application Programming Interface, web
    services)

13
Pourquoi un moteur de recherche est-il si rapide
pour chercher dans des milliards de pages ?
  • Réponse il ne cherche pas !
  • Il a déjà toutes les réponses aux requêtes qui
    lui sont formulées.

Chaque requête est une métadonnée
Source  C. Fauré
14
Moteur de rechercheet texte mining
  • Texte mining  art de générer automatiquement des
    métadonnées.gt plusieurs méthodes
  • - Recherche  plein texte  (occurrences)
  • - Recherche associative (statistique  les
    vecteurs)
  • - Recherche linguistique (tokenisation,
    lemmatisation, entity extraction)
  • - Recherche sémantique (structurée)  le moteur
    s'appuie sur des référentiels (à partir d'un
    référentiel métier par exemple)

Source  C. Fauré
15
Principe des moteurs
  • Pour trouver de l'information, certes. Mais
    surtout pour
  • trouver rapidement l'information
  • trouver de l'information dans des sources
    diverses et hétérogènes
  • rechercher dans des informations peu ou
  • faiblement structurées

16
Complémentarité des approches
Source  C. Fauré
17
Appréhension de linfo
Source Info_at_vis
18
Matching correspondance des mots-clés dune
requête avec les mots-clés représentant  le(s)
document(s) résultat  (système documentaire).
Watching une  vue  des résultats introduite
par une organisation spécifique (ex. page rank,
clusterisation, recommandation, etc) (monde des
moteurs) et classements affinitaires
personnalisés (monde des réseaux sociaux)gtgtgtgtgt
la question des algorithmes et des  outils de
visualisation  de l'information
19
http//www.davidgaliana.fr/medias-sociaux/infograp
hie-60-secondes-sur-le-web/
20
Où chercher ?
  • Information contenue sur les ordinateurs
    individuels
  • plusieurs millions dordinateurs inter-connectés

P2P
  • bases de données spécialisées
  • Contenu dynamique
  • Index partiel des sites
  • Interdiction dindexation

Web invisible (web profond)
Web visible et Web 2.0 (web surfacique)
  • 1000 Milliards de
  • Pages web ?
  • Forum de
  • discussion
  • Contenu indexable,
  • contenu taggé

À partir de source Eric Boutin
21
Usages des moteurs
21 du temps passé en ligne est consacré à la
recherche
93 des internautes utilisent les moteurs de
recherche pour trouver et accéder aux sites
46 des recherches concernent des informations
sur des produits ou des services (e-commerce)
57 des internautes cherchent sur le web chaque
jour
50 du trafic dun site vient dun moteur de
recherche (France)
Infographiclabs, 2010, GO-Gulf, 2012,
Médiamétrie, 2012
Source  A. Bouchard
22
Sites les plus visités
Paul Jacionis, 05/2012
Source  A. Bouchard
23
Nombre de requêtes
Etude comScore, 2013
Source  A. Bouchard
24
La personnalisation de la recherche
 Lalgorithme de Google utilise plus de 200
paramètres pour affiner une requête. Cela inclut
le PageRank du site internet, la localisation
géographique de linternaute, les liens sur
lesquels il clique généralement, la façon dont il
modifie ses requêtes quand il nest pas
satisfait, ainsi que son historique de
recherche  (T. Vanderbilt, 2013, voir également
infographie)
Personnalisation sur Google (étude A. Hannak et
al., 2013) - 12 des résultats différents -
basée surtout sur lidentification au service et
sur ladresse IP (localisation)
25
Les opérateurs(les booléens et les autres)
OR
AND
AND NOT
( )
Formadoct http//guides-formadoct.ueb.eu/conten
t.php?pid111868sid842560
link
site
filetype
as_qdrd15
allinurl
Fonctionnalités http//www.google.fr/intl/fr/hel
p/features.html
mais surtout de plus en plus dinterfaces à
comprendre, à appréhender, à suivre, ... Exemple
avec Google gt
26
La Galaxie Google
  • Google Trends (comparaison de termes, de sites)
    http//trends.google.com
  • Ex  http//www.google.org/flutrends/
  • Google Alerte http//www.google.com/alerts
  • Google Custom Search http//www.google.fr/cse/
  • ... http//www.google.fr/intl/fr/options/
  • Google Knwoledge Graph http//insidesearch.blogsp
    ot.fr/2012/05/introducing-knowledge-graph-things-n
    ot.html
  • - Attention google and your memory 
    http//www.onlinecolleges.net/2011/09/19/google-an
    d-your-memory/

27
2Les outils de recherche
  1. En Bibliothèque (ex de lUNS)
  2. Sur le Web

28
Ressources en BU
Catalogue et ressources électroniques
29
Exercice avec les outils de la bibliothèque
  • je cherche si l'ouvrage  Nous n'avons jamais
    été modernes essai d'anthropologie
    symétrique  de Latour Bruno . Est disponible
    dans une BU de l'université...comment faire ?
  • Dans quelle(s) autre(s) BU en France l'ouvrage
    est-il disponible ? ... comment faire ?
  • je souhaite lire l'ouvrage  Sociologie de la
    traduction Textes fondateurs, de Latour,
    Bruno. Callon, Michel. Akrich, M. ?  comment
    faire ? Conseillez-moi.

30
  • je cherche à savoir ce qu'est le "Dreaming" pour
    les Aborigènes dAustralie ... comment faire ?
  • je cherche un article du Courrier International
    intitulé Le livre à l'ère du numérique
    Attention, le livre électronique décolle !... (13
    avril 2008) comment faire ?
  • savez-vous si je peux consulter les articles
    (full-text) des revues "Agricultural and Forest
    Meteorology" et "Journal of Documentation  ?
    (précisez)

31
Ressources sur le web
Exemples doutils(panorama sur le web)
32
Le Web chercher des références et les textes
associés
  • Le  monde de Bibliothèques  (cat. et BN)
  • Les Dictionnaires et les encyclopédies (Dico
    Co)
  • Les Archive Ouvertes et Revues en ligne (AO Co)
  • Les outils du  web2.0 
  • Les Moteurs
  • Les outils  embarqués  (extensions navigateur)
  •  son  moteur
  • La méthode Push (selon déroulement du cours)

33
Le  monde des bibliothèques 
  • Catalogues
  • Dédié aux thèses http//www.theses.fr/
  • Worldcat http//worldcat.org/
  • JournalTOC http//www.journaltocs.ac.uk/
  • Ne pas oublier Amazon, chapitre.com, decitre..
  • Bibliothèques Numérique
  • Gallica http//gallica.bnf.fr/
  • Europeana http//www.europeana.eu/portal/
  • Hathi trust http//www.hathitrust.org/
  • Wikisource http//fr.wikisource.org/wiki/Wikisou
    rceAccueil
  • . Le projet Gutenberg (ebook) http//www.gutenber
    g.org/wiki/Main_Page
  • . Internet Archive (le web) http//www.archive.o
    rg/
  • . Google book http//books.google.com/
  • . Liste des Bibliothèques numériques
    http//www.science.gouv.fr/fr/bibliotheques-numeri
    ques/ et http//signets.bnf.fr/html/categories/c_
    011textes_num.html

34
Dico Co
  • Wikipedia http//fr.wikipedia.org/wiki/Accueil
  • Scholarpedia http//www.scholarpedia.org/
  • CNRTL Centre National de Ressources Textuelles
    et (Morphologies, Lexicographie, Etymologie,
    Synonymie, Antonymie, Proxémie, Concordance)
    http//www.cnrtl.fr/lexicographie/ (accès à TLFI
    et d'autres dictionnaire)
  • Dicorama  http//www.dicorama.com/

35
OA Co
  • HAL http//hal.archives-ouvertes.fr/
  • Revues.org http//www.revues.org/
  • Persee http//www.persee.fr/web/guest/home/
  • OAIster (cf. Worldcat) http//oaister.worldcat.o
    rg/
  • Base  http//www.base-search.net/
  • ISIDORE http//www.rechercheisidore.fr/
  • OpenDOAR http//www.opendoar.org/
  • Scientific commons http//www.scientificcommons.or
    g/
  • DOAJ http//www.doaj.org/

36
Le web2.0Recherche  verticale 
  • Signets Diigo  http//www.diigo.com/,
    Delicious
  • Ref biblio CiteUlike http//www.citeulike.org/
    , LibraryThing http//www.librarything.com,
    Mendeley http//www.mendeley.com
  • Illustrations Flickr http//www.flickr.com/ ,
    youtube http//www.youtube.com/ ,
  • Présentations PPT http//www.slideshare.net
  • Tweets  search de twitter et Topsy
    http//topsy.com/
  • Transversaux (avec choix)  Qwant,
    socialmention,...

37
Les outils de recherche du web(quelques exemples)
  • Moteurs  academics 
  • Google scholar http//scholar.google.com
  • Microsoft academics search  http//academic.rese
    arch.microsoft.com/ (voir aussi
    http//academic.research.microsoft.com/AcademicMap
    ) (ex avec UPF)
  • Scirus http//www.scirus.com
  • JURN http//www.jurn.org/
  • ...
  • Cf aussi dia AO co

38
Les outils de recherche du web(quelques exemples
- suite)
  •  Verticaux  selon plateforme
  • choix du  vertical  http//socialmention.com/
  • Selon les droits associés http//search.creative
    commons.org/
  • Moteurs inversés
  • Tineye http//www.tineye.com/
  • Midomi http//www.midomi.com
  • Moteur collaboratifs  Blekko
  • Moteur  anomysé   Duckduckgo
  • Moteur  vocal   google sur chrome
  • Recherche dans la vidéo Voxalead
    http//voxaleadnews.labs.exalead.com/
  • Moteur de réponses WolframAlpha,
    https//www.wolframalpha.com
  • MétaMoteurs
  • Ixquick http//www.eu.ixquick.com/fra/
  • Clusty http//clusty.com/
  • Interfaçage
  • SearchCube http//search-cube.com/
  • Oamos http//www.oamos.com/
  • Moteurs de médias
  • Vidéos http//www.blinkx.com/
  • Images http//www.picsearch.com/
  • Sur mobile phone
  • Google googles
  • Shazam, Soundhound
  • ...

39
  • Outils embarqués des extensions FireFox
  • Tous les outils dans un menu déroulant
  • Add to search https//addons.mozilla.org/en-US/f
    irefox/addon/3682
  • Ajout de fonctionnalités sur certain outils de
    recherche.
  • search Cloudlet https//addons.mozilla.org/fr/fi
    refox/addon/search-cloudlet-for-google-yah/
  • ...
  • Sur mesure créer son moteur de recherche (ex
    LeMien)?
  • sur google custom search (ex co-op) ,
    équivalent de lopérateur site multiplié à
    souhait http//www.google.com/coop/cse/

40
Exercices
  1. Je dois me déplacer à l'université de Nouvelle
    Calédonie, indiquez-moi la(es) références
    bibliographique(s) des ouvrages de Bruno latour,
    (postérieur à 2010) que je pourrai consulter sur
    place.
  2. Je souhaite me procurer l'article  Zalasiewicz,
    J., P.J. Crutzen, et W. Steffen. 2012.  Chapter
    32 - The Anthropocene . In The Geologic Time
    Scale, Boston Elsevier, p. 1033-1040.
    Conseillez moi !
  3. Je souhaite me procurer l'article  Slaughter,
    Richard A. 2012.  Welcome to the anthropocene .
    Futures 44(2) 119-126.. Conseillez moi !
  4. Sur Google, Je cherche des documents en pdf qui
    comportent le mot-clé  énergie  sur le site du
     ministère de l'environnement .(rédigez la
    requête)
  5. Sur Google, comment trouver des documents qui
    comportent le mot clés anthropocene et sont
    datés de 2011 sur le site de l'université de
    Nice
  6. Je cherche des images libre de droits pour
    illustrer mon cours sur anthropocene 
  7. Je cherche des images similaires à
    http//grandquebec.com/upl-files/ours_polaire.jpg
  8. Quelle est la référence bibliographique originale
    du document comportant l'extrait suivant
    La maîtrise de lénergie mécanique a été le fait
    dartisans et de techniciens souvent étrangers
    aux cercles scientifiques

41
Exercices (suite)
  1. je souhaite lire l'ouvrage  l'origine des
    espèces de C. Darwin comment faire ?
    Conseillez-moi.
  2. Je souhaite être averti par mail des nouvelles
    publications de la revue dont l'ISSN est 
    1869-1099 ? Conseillez-moi.
  3. Quel est le titre de louvrage dont lisbn est
    9782343002538
  4. Je cherche le document dont le titre est 
     Conservation and social-ecological systems in
    the 21st century of the Anthropocene era .
  5. Je cherche l'article de la revue  Nonprofit and
    Voluntary Sector Quarterly  de l'éditeur  Sage
    journals  intitulé  Volunteerism Research A
    Review Essay , Conseillez-moi.
  6. Je veux lire la totalité de l'ouvrage dont le
    titre est  The Pacific Northwest Research
    Station's biodiversity initiative ... .
    Conseillez-moi.
  7. Je souhaite avoir un aperçu des publications de
    Stevan Harnad, conseillez-moi
  8. Quelle est l'invention notable de Theodore Maiman
    ? conseillez-moi

42
Vos questions
?
Write a Comment
User Comments (0)
About PowerShow.com