Title: Internet
126 novembre 2002
- Trouvez de linformation sur le Web
- Facteur dimpact et autres index bibliométriques
2(No Transcript)
3 un vaste réseau mondial dordinateurs
Internet
4 Web
FTP
Email
Forum/discussion
Autres
Daprès In practice, Vol. 20, 8, 463-465
5world wide web web www
Donne accès à de 2 milliards de documents
6SSI les différents ordinateurs peuvent
communiquer ensemble de façon transparente pour
lusager, indépendamment des types dordinateurs
utilisés !
7Ssi
- transfert des informations bien établi
- reconnaissance des machines
- identification des documents
8sur le web
Langage HTML (HyperText Markup Language)
9Un document hypertexte
Permet une lecture non linéaire grâce à la
présence de liens activables dans les documents
HYPERLIENS
- En pratique couleur différente de celle du
texte, ou souligné - Suivez la main pointant lindex !
10sur le web
Transfert dinformations
Protocole TCP/IP
11sur le web
Transfert dinformations
Reconnaissances des machines
Adresse IP 139.165.163.11
12sur le web
Transfert dinformations
Reconnaissances des machines
Identification des documents
13 Son adresse appelée adresse URL pour Uniform
Ressource Locator
14http//www.serveur.be/Repertoire/Document.html
le document affiché sappelle Document.html, Il
se trouve sur une machine dont le nom est
www.serveur.be, et sur cet ordinateur, il se
trouve dans le dossier Repertoire
15Quelques exemples de domaines géographiques
- be Belgique uk Royaume-Uni
- fr France jp Japon
- de Allemagne dk Danemark
- es Espagne etc.
- Ca Canada
16Quelques exemples de domaines par catégories
- com Organismes à but commercial
- org Organismes à but non lucratif
- gov Organismes gouvernementaux américains
- edu Universités, collèges américains
- ac Universités, collèges autres
-
17En pratique lors de limpression
- attention à la structure de la page Web
- cadres (frames)
18http//www.ansi.okstate.edu/breeds/cattle/
19(No Transcript)
20En pratique
erreur 404 (intitulé Not found, Page not
found ou Document not found)
21(No Transcript)
22(No Transcript)
23Environ 7 millions de pages Sont ajoutées chaque
jour Sur le réseau
24 25- ne pas prendre pour argent comptant une
information trouvée sur Internet
26- ne pas prendre pour argent comptant une
information trouvée sur Internet
- on ne trouve pas tout sur Internet mais on
trouve de Tout !!
27Pour trouver linformation sur Internet
Par mots clés
Par thème
AltaVista
Yahoo !
Google
28aucun de ces outils ne couvre plus de 20 du Web
visible ! !
- Web visible
- Web invisible
de 200 fois le volume du Web visible !
- les banques de données
- les sites qui nécessitent une identification
préalable - les sites offrant des fichiers dans certains
formats (tableurs, PDF, ) - les sites dont les éditeurs ont décidé
dinterdire leur indexation par un robot (balises
Méta).
29- Principe
- hiérarchie de catégories et de sous-catégories
-
- Cette arborescence est le résultat d un travail
humain !
30- Objectif
- répertorier les sites Web et les classer dans des
catégories thématiques
- Principe
- hiérarchie de catégories et de sous-catégories
- Cette arborescence est le résultat d un travail
humain !
31- Principe de fonctionnement
- le recensement d un site implique une démarche
volontaire de son éditeur
- Modalités de recherche
- pour la plupart 2 modes de consultation
- par rubriques et sous-rubriques
- par saisie de mot(s)
32- répertoires généralistes
- répertoires sélectifs
2 types de répertoires
- les plus connus !
- Nomade
- Open Directory Projet
- Yahoo!
très spécialisés et très ciblés !
33- Répertoire le plus connu
- http//www.yahoo.com/
34(No Transcript)
35Soit recherche hiérarchique dans les catégories
--gt Sciences et technologies gt Biologie gt
Zoologie gt Animaux gt Reptiles et amphibiens gt
Serpents
36Soit en introduisant des mots dans le champ de
saisie
!! en respectant la synthaxe de recherche !!
37Opérateurs booléens ET signe python
monty python ET monty OU
implicite python monty python OU monty
SAUF signe - python -monty python SAUF
monty Recherche dexpressions guillemets
vache folle Expression vache
folle Troncature - joker
38Question python(s) mais pas les Monty Python
39(No Transcript)
40Qui recense uniquement les informations en
français sur les sites francophones !
41! Nouveau service de Yahoo ! France
lorsque la recherche ne fournit aucun résultat
dans Yahoo ! , la requête est automatiquement
redirigée vers Google
42- Principe
- repose sur la simple recherche de la présence des
mots clés dans les pages dun siteClassement
par pertinence !
43Moteurs de recherche par mots clés
Alta Vista http//www.altavista.com/ Hotbot http
//www.hotbot.com/ Excite http//www.excite.com/
Infoseek http//www.infoseek.com/ Lycos http//
www.lycos.com/ Web Crawler http//www.webcrawler.c
om/ Google http//www.google.com/
44http//www.altavista.com
45Nouvel interface depuis novembre 2002
disponible maintenant en anglais, français,
espagnol, italien et allemand
46pour chat
L'outil vous offre des termes en rapport avec
votre requête
47Minuscules/majuscules mot saisi en minuscule
toutes les occurences sont recherchées biologie
biologie, Biologie, BIOLOGIE
mot saisi avec une majuscule loccurence exacte
est recherchée Biologie biologie,
Biologie, BIOLOGIE Lettres accentuées prise
en compte de loccurence du mot saisi
lymphoïde lymphoide lymphoide
lymphoide, lymphoïde
48Opérateurs booléens ET signe chat
souris chat ET souris OU
implicite chat souris chat OU souris
SAUF signe - chat -souris chat SAUF
souris Recherche dexpressions guillemets
vache folle expression vache
folle Troncature - joker
49Recherches particulières
Recherche sur un titre de page title Recherche
sur un domaine donné domain Recherche sur le
nom du serveur host Recherche sur une adresse
URL url Recherche sur le texte uniquement text
50Classement des résultats
par pertinence
En pratique les 20 premiers !
51http//www.google.fr http//www.google.com
Son originalité classement des résultats basé
sur le calcul de la popularité des pages
! càd selon le nombre de liens pointant vers
elles sur le réseau ( page bank )
52(No Transcript)
53- moteur qui permetde lancer une requête
simultanément sur - son index ( 2,5 milliards de pages)
- sur le répertoire de sites Web inscrits dans
lOpen Directory
54Opérateurs booléens ET implicite chat
souris chat ET souris chat AND souris chat ET
souris OU OR (en majuscule !) chat OR
souris chat OU souris Recherche dexpressions
guillemets vache folle expression
vache folle Pas de troncature - joker !
55Minuscules/majuscules interprète
indifféremment les majuscules ou les
minuscules Lettres accentuées ne prend pas
en compte les accents ! donc même nombre de
résultats pour lymphoide ou lymphoïde !
56Recherches particulières
Recherche sur un titre de page intitle Recherc
he sur une adresse URL inurl Recherche de
documents au format particulier filetype Re
cherche de pages d un même type related Pages
qui pointent vers une page donnée link
57Recherches particulières
Par exemple linkwww.ulg.ac.be/fmv tous les
sites pointant vers cette URL filetypepdf
chien OR chiens tous les documents en format
PDF traitant de chien(s)
58Description de linformation 1. Nom de la
page 2. Extrait de la page contenant le(s)
terme(s) de la requête 3. Description de la
page 4. Catégories de classement (cf. Open
Directory) 5. URL - taille de la page - date
dindexation de la page
59En cache donne accès à une copie de la page,
telle quelle était le jour où le robot du moteur
la indexée
Pages similaires permet dobtenir un nouvel
écran de résultats, offrant une nouvelle
sélection de pages en rapport avec lURL initiale
60 appréciation de la valeur des journaux
scientifiques
61Facteur dimpact rapport pour les deux années
précédentes du nombre de fois où une revue a été
citée dans des revues recensées par rapport au
nombre total des articles parus dans cette revue
Par ex. pour le Journal of Animal Science nbre
de citations (1999 2000) 426 709
1135 Nbre darticles publiés (1999 2000) 404
449 853 FI du J. Anim. Sc. 1135/853
1.331
62Par ex. pour le Journal of Animal Science en
2001 9,4 ans càd 50 des articles cités dans
cette revue en 2001 ont été publiés au cours des
9,4 années précédentes
63Par ex. pour le Journal of Animal Science en
2001 9,2 ans 2001 0,89 2000 4,46
1999 10,40 1998 17,76 1997 24,00
etc jusque 50
64Par ex. pour le Journal of Animal Science en
2001 en 2001 106 articles de 2001 cités en
2001 sur 377 articles publiés -gt 106/377 0,281
65Journal Citation Reports via lintranet (accès
par page daccueil de la Bibliothèque)
663.
1.
2.
1
1. les périodiques ayant cités le J. Anim. Sc. 2.
les périodiques cités par le J. Anim. Sc. 3.
graphe représentant lévolution du facteur
dimpact sur les 5 dernières années