Recherches documentaires - PowerPoint PPT Presentation

1 / 56
About This Presentation
Title:

Recherches documentaires

Description:

D veloppement du protocole d' change TCP/IP, r seaux de recherche universitaires ... L 'adjonction d 'un deuxi me terme conduit dans la plupart des cas ... – PowerPoint PPT presentation

Number of Views:157
Avg rating:3.0/5.0
Slides: 57
Provided by: DGCO
Category:

less

Transcript and Presenter's Notes

Title: Recherches documentaires


1
Recherches documentaires bibliographiques sur
Internet
  • Inform_at_tion documentaire du CO
  • Gestion informatisée des bibliothèques PO
  • patrick.johner_at_edu.ge.ch patrick.gay_at_edu.ge.ch

2
Débusquer de l information sur le WEB
  • Internet p. 3
  • Recherches documentaires p. 10
  • Moteurs de recherche p. 19
  • Recherches bibliographiques p. 40
  • Favoris
    p. 54


3
Internet - historique
  • Années 70 ARPANET
  • Réseau de communication à longue distance par
    paquets réservé à la recherche militaire
  • Années 80 INTERNET
  • Développement du protocole déchange TCP/IP,
    réseaux de recherche universitaires
  • Années 90 WEB
  • Logiciel développé au CERN pour la communauté des
    physiciens. Mosaïc premier navigateur

4
Internet - services disponibles
  • Sites WEB
  • http//wwwedu.ge.ch/dip/biblioweb
  • Messagerie électronique
  • patrick.johner_at_edu.ge.ch
  • Listes de diffusion
  • swiss-lib_at_lists.switch.ch
  • Accès à des banques de données
  • Telnet
  • Echanges de données
  • FTP

5
Internet - caractéristiques
  • Protocole TCP/IP
  • Langage commun à tous les types de machines et de
    système dexploitation
  • Interconnexion des tous les réseaux
  • Dialogue entre toutes les machines, 15 de plus
    dutilisateurs par mois.
  • Administration centrale minimale
  • Effort coopératif, suffixes de domaine, les
    adresses des machines (IP). Chaque adresse
    numérique a un équivalent en clair.
  • Connexion par réseau ou modem

6
Internet -WORLD WIDE WEB (WWW)
  • Logiciels utilisés Navigateur
  • Comminicator de Nescape
  • Explorer de Microsoft
  • Caractéristiques
  • Accès aux serveurs par URL (http//wwwedu.ge.ch)
  • Accès à des informations multimédia, liens
  • Langage HTML
  • Protocole HTTP
  • 3000 serveurs en 1994 - 93 millions en 2001

7
Internet - critique de linformation
  • Hétérogénéité contenu et le codage
  • Instabilité
  • Fragmentation
  • Renouvellement continuel
  • Non structuré
  • Multilinguisme
  • Publique / privé / commercial

8
Internet - typologies des sites
  • Guides pratiques
  • http//easynet.fr/part/guide
  • Les entreprises (catalogues, prix, produits,
    collaborateurs)
  • http//www.onatoo.com
  • Les sites de références (associations, organismes
    )
  • http//frc.ch
  • Les pages bénévoles
  • http//www.idf.net/articles/open-directory-project
    .html
  • Laboratoires de recherches ou Universités
  • http//uquam.ca
  • Les bibliothèques
  • http//www.snl.ch
  • Les sites gouvernementaux ou institutionnels
  • http//www.geneve.ch
  • Les banques de données
  • http//www.unige.ch/biblio/ses/bdd/sld001.html
  • Les organismes de presse
  • http//www.webdo.ch
  • Encyclopédies
  • http//www.webencyclo.com/home/home.asp

9
Internet - déchiffrer les URL
  • Http// protocole
  • www. Web
  • Geneve. Nom
  • Ch Extension
  • http//www.geneve.ch
  • URL (Uniform Ressource Locator)

10
R-DOC - indexation des sites
  • Déclaration volontaire du site par son Webmaster,
    il est aussi possible d influencer les robots en
    mettant certaines indications dans le titre des
    pages, en choisissant la place des termes, en
    utilisant en HTML les zones meta- données (Head)
    ou se trouvent les mots-clés, titres ...
  • A travers un robot (spider ou crawler) qui
    explore de manière automatique la toile, il se
    faufile par les liens, seules les pages HTML sont
    prises en compte, il reste une importante partie
    non indexées somme les bases de données, les
    documents PDF (sauf Google)
  • passage tous les 2-3 mois vu la taille du WEB.

11
R-DOC - page en HTML
12
R-DOC - vocabulaire de l indexation
  • Mots vides
  • Indexation au mot
  • Indexation en texte intégral
  • Index monochamp
  • Index multichamps
  • Recherche en langage naturel
  • Indexation automatique
  • Analyse sémantique
  • Analyse phonétique

13
R-DOC - mode d interrogation
  • simple (millier de réponses)
  • 90 des requêtes se font en utilisant un seul mot
    clé
  • L adjonction d un deuxième terme conduit dans
    la plupart des cas à un élargissement de la
    recherche, alors que l effet contraire est
    souhaité
  • avancée (la réponse)
  • 5 des utilisateurs vous je l espère !!!
  • Accès à la syntaxe de recherche avancée
    (opérateurs, syntaxe )

14
R-DOC - méthodologie de recherche
  • Quel est le sujet précis ?
  • Je recherche de l information sur la maladie de
    la vache folle
  • Quelle limite géographique, linguistique,
    temporelle ?
  • Documents en français de moins de trois ans
  • Quels mot clés conviendrait ?
  • Maladie de la vache folle
  • Moteur de recherche utilisé ?
  • Http//metacrawler.com/index.html
  • Formulation précise de la recherche ?
  • Maladie de la vache folle
  • Les réponses sous quelle forme ?
  • Une adresse de site intéressant
  • Validité de l information ?

15
R-DOC - Metacrawler 1 ttp//www.METACRAWLER.COM
16
R-DOC - Metacrawler 2 ttp//www.METACRAWLER.COM
17
R-DOC - pages de résultats
  • Présentation par ordre de pertinence selon règles
    et hiérarchies pré-établies
  • emplacement du terme recherché, dans le titre,
    les mots-clé, texte ...
  • fréquence dapparition du terme dans le document
  • par popularité (nombre de liens qui pointent sur
    le site)
  • Mais doublons souvent présents

18
R-DOC - essayer les outils
  • J aimerais de la documentation sur les
    bibliothèques virtuelles
  • Essayez virtual libraries
  • Comparez le nombre de réponses

19
M-REC - moteurs de recherches
  • Outils permettant de trouver des données sur
    Internet
  • Recherche sur les pages HTML
  • 1500 moteurs de recherche
  • 95 internautes utilisent le 10 des moteurs
  • 44 des internautes mécontents
  • 80 des gens passent le 70 du temps à chercher
  • 54 des sites indexé, mais ½ du contenu réel

20
M-REC - typologie
  • Métamoteurs
  • WEBCRAWLER http//ww.webcrawler.com
  • Thématiques ou hiérarchiques
  • Yahoo http//fr.yahoo.com/
  • Généralistes
  • GOOGLE http//www.google.com
  • ALTAVISTA / EXIT /LYCOOS / INFOSEEK / HOTBOT
  • Disciplinaires

21
M-REC - répertoires thématiques
  • Valeur ajoutée
  • Limitation du bruit
  • Donne adresses des sites
  • Biais par couverture régionale
  • Accès direct limité
  • Mises à jour aléatoires

22
M-REC - Yahoo 1 http//fr.yahoo.com/
23
M-REC - Yahoo 2 http//fr.yahoo.com/
24
M-REC - essayer l outil
  • Nous cherchons de l information sur la musique
    baroque
  • Nous cherchons des informations sur le climat au
    Sénégal

25
M-REC - robots généralistes
  • Simplicité dutilisation
  • Couverture la plus complète
  • Mise à jour automatique et rapide
  • Amélioration constante
  • Bruit
  • Doublons non détectés
  • Hétérogénéité des réponses

26
M-REC - Google 1 http//www.google.com/
27
M-REC - Google 2 http//www.google.com/
28
M-REC - essayer l outil
  • Trouvez l adresse du site des bibliothèques de
    l enseignement secondaire à Genève
  • Je voudrais trouver le taux de change du dollar
    canadien en francs français
  • Taux de change
  • Dollar canadien
  • Franc français

29
M-REC - agents intelligents
  • Autonomie
  • Capacité à communiquer
  • Capacité à coopérer
  • Capacité à raisonner
  • Comportement adaptatif
  • Fidélité
  • Authentification, confidentialité
  • Sécurité
  • Compétence
  • Intégrité

30
M-REC - Interface de recherche unifiée
  • Un exemple COPERNIC
  • Logiciel qui fait appel à différents outils de
    recherche de façon simultanée
  • Requête envoyée à plusieurs outils simultanément
  • Syntaxe propre pour formuler la requête
  • Valeur ajoutée
  • éliminer les doublons
  • présentation unifiée des résultats
  • recalculer les indices de pertinences
  • Appauvrissement des fonctions de recherche

31
M-REC - Copernic 1 http//www.copernic.com/fr
32
M-REC - Copernic 2 http//www.copernic.com/fr
33
M-REC - Copernic 3 http//www.copernic.com/fr
34
M-REC - difficultés dinterrogation
  • Langue
  • Synonymes
  • voiture et automobile
  • Polysémie
  • jaguar (animal, voiture)
  • Orthographe
  • Accents

35
M-REC - syntaxe dinterrogation
  • Opérateurs booléens
  • et/ou/sauf
  • Opérateur de proximité, adjacence
  • Troncature
  • Caractères Joker
  • Parenthèses
  • Opérateurs -
  • Majuscules / minuscules
  • Expression   
  • A CONNAITRE

36
M-REC - Abondance http//www.abondance.com/
37
M-REC - Google mode d emploi
  • Minuscules/majuscules Idem
  • Ordre des mots Important
  • OU OR
  • ET Opérateur par défaut
  • SAUF -
  • Troncature Non
  • Recherche linguistique
  • Recherche sur le nom du site site
  • etc ...

38
M-REC - Comparaisons de robots
  • Notoriété et contenu des index
  • Contenu de l index
  • Fonctionnalités d interrogation
  • Fonctionnalités de visualisation
  • Fonctionnalités spécifiques

39
M-REC - maîtriser l outil
  • Nous cherchons des informations sur la
    construction du Pont Butin à Genève
  • Utilisez les trois moteurs de recherche
  • Regardez les résultats et vous aurez une étendue
    des interprétations
  • Comparez les trois premiers résultats de chaque
    recherche

40
R-BIB - recherches bibliographiques
  • Catalogues de bibliothèques disponibles sur
    Internet
  • Bibal Web
  • Bibliothèques scolaires Genève
  • BN Opale plus
  • Bibliothèque Nationale de France
  • Rero
  • Bibliothèques universitaires romandes

41
R-BIB - BIBALWEB 1 http//wwwedu.ge.ch/dip/bibliow
eb
42
R-BIB - BIBALWEB 2 http//wwwedu.ge.ch/dip/bibliow
eb
  • Dernière version 370 000 notices
  • La base de données des bibliothèques de
    l'enseignement secondaire postobligatoire n'est
    pas un catalogue collectif. Il s'agit de la
    réunion de l'ensemble des catalogues des
  • 26 bibliothèques rattachées à cet ordre
    d'enseignement
  • d'un service, l'Office d'orientation et de
    formation professionnelle (OOFP)
  • d'une école professionnelle, le Centre
    d'Enseignement de Professions de la Santé et de
    la Petite Enfance (CEPSPE)
  • De ce fait, une même notice pourra se retrouver
    plusieurs fois dans cette base de données avec de
    légères différences.

43
R-BIB - BIBALWEB 2 http//wwwedu.ge.ch/dip/bibliow
eb
44
R-BIB - essayer l outil
  • Dans quelle bibliothèque puis-je trouvez un
    exemplaire de la Peste de Albert Camus ?
  • Quelle est le numéro de téléphone à faire pour
    réserver ce livre
  • Est-ce possible d aller consulter ce livre un
    mercredi après-midi

45
R-BIB - BN Opale Plus 1 http//www.ccfr.bnf.fr
46
R-BIB - BN Opale Plus 2 http//www.ccfr.bnf.fr
  • Catalogue collectif de France offre dès janvier
    2001 14 millions de notices d ouvrages et de
    périodiques des principales bibliothèque de
    France.
  • Catalogue BN Opale (7 millions à la bibliothèque
    nationale)
  • Catalogue système universitaire (4 millions dans
    le réseau des 100 bibliothèques universitaires)
  • Catalogue des fonds anciens (2 millions)

47
R-BIB - BN Opale Plus 3 http//www.ccfr.bnf.fr
48
R-BIB - essayer l outil
  • Combien d auteurs ont pour nom Bazin ?
  • Citez nous un titre d Hervé Bazin
  • Où puis-je consulter cet ouvrage ?

49
R-BIB - RERO 1 http//www.rero.ch/
50
R-BIB - RERO 2 http//www.rero.ch/
  • La base de données bibliographiques RERO (Réseau
    des bibliothèques de Suisse occidentale) contient
    la plupart des documents
  • des bibliothèques cantonales universitaires et
  • des bibliothèques spécialisées de Suisse romande.
  • Le système informatique s'appelle VTLS (Virginia
    Tech Library System). Il s'agit d'un système
    américain, adopté par la Bibliothèque nationale
    suisse, que l'on retrouve, en outre, dans de
    nombreuses bibliothèques européennes (Finlande,
    Ecosse, Catalogne, Belgique, Pologne, Russie,
    etc.).

51
R-BIB - RERO 3 http//www.rero.ch/
52
R-BIB - essayer l outil
  • Préparez rapidement une petite liste des ouvrages
    (bibliographie) de Jacques Chessex, avec les
    titres et la date présumée de la première édition.

53
R-BIB - maîtriser l outil
  • Combien d exemplaires du livre
  • Dictionnaire des difficultés de la langue
    française / par Adolphe V. Thomas .- Larousse,
    1980 ou 1988
  • Se trouvent au DIP-GE
  • En Suisse romande,
  • En France

54
FAVORIS - adresses citées
  • MOTEURS
  • http//ww.webcrawler.com
  • http//www.google.com/
  • http//fr.yahoo.com/
  • http//www.METACRAWLER.COM
  • AUTRES
  • SITES WEB
  • http//wwwedu.ge.ch/dip/biblioweb
  • http//www.ccfr.bnf.fr
  • http//www.rero.ch
  • http//www.abondance.com/
  • http//www.copernic.com/fr

http//www.adbs.fr/adbs/sitespro/lardy/toc.htm htt
p//formist.enssib.fr/412567A0004D098D/Vframeset/E
AUTO http//www.multimania.com/soshg/unmoteur.htm.
http//www.ccr.jussieu.fr/urfist/guide.htm
55
FAVORIS - créez vos signets
  • Avoir le réflexe de mettre dans les favoris ou
    signets les bonnes adresses
  • Constituer des dossiers par thèmes
  • Possibilités d exporter et/ou d importer les
    signets
  • dun ordinateur à un autre
  • sur pages Word ou WEB

56
Favoris - Pour aller plus loin
  • La recherche intelligente sur lInternet  outils
    et méthodes / Henry Samier, Victor Sandoval.
    Hermès, 1998
  • Moteurs de recherche pour le Web /Alfred et Emily
    Glossbrenner. First interactive, 1999
  • http//www.adbs.fr/adbs/sitespro/lardy/toc.htm
  • http//formist.enssib.fr/412567A0004D098D/Vframese
    t/EAUTO
  • http//www.multimania.com/soshg/unmoteur.htm.
  • http//www.ccr.jussieu.fr/urfist/guide.htm
Write a Comment
User Comments (0)
About PowerShow.com