Title: Internet
1(No Transcript)
2 un vaste réseau mondial dordinateurs
Internet
3 Web
FTP
Email
Forum/discussion
Autres
Daprès In practice, Vol. 20, 8, 463-465
4world wide web web www
Donne accès à de 2 milliards de documents
5SSI les différents ordinateurs peuvent
communiquer ensemble de façon transparente pour
lusager, indépendamment des types dordinateurs
utilisés !
6Ssi
- transfert des informations bien établi
- reconnaissance des machines
- identification des documents
7sur le web
Langage HTML (HyperText Markup Language)
8Un document hypertexte
Permet une lecture non linéaire grâce à la
présence de liens activables dans les documents
HYPERLIENS
- En pratique couleur différente de celle du
texte, ou souligné - Suivez la main pointant lindex !
9sur le web
Transfert dinformations
Protocole TCP/IP
10sur le web
Transfert dinformations
Reconnaissances des machines
Adresse IP 139.165.163.11
11sur le web
Transfert dinformations
Reconnaissances des machines
Identification des documents
12 Son adresse Appelée adresse URL pour Uniform
Ressource Locator
13http//www.serveur.be/Repertoire/Document.html
le document affiché sappelle Document.html, Il
se trouve sur une machine dont le nom est
www.serveur.be, et sur cet ordinateur, il se
trouve dans le dossier Repertoire
14http//www.serveur.be
15Quelques exemples de domaines géographiques
- be Belgique uk Royaume-Uni
- fr France jp Japon
- de Allemagne dk Danemark
- es Espagne etc.
- Ca Canada
16Quelques exemples de domaines par catégories
- com Organismes à but commercial
- org Organismes à but non lucratif
- gov Organismes gouvernementaux américains
- edu Universités, collèges américains
- ac Universités, collèges autres
-
17En pratique lors de limpression
- attention à la structure de la page Web
- cadres (frames)
18http//www.ansi.okstate.edu/breeds/cattle/
19(No Transcript)
20En pratique
erreur 404 (intitulé Not found, Page not
found ou Document not found)
21(No Transcript)
22(No Transcript)
23Environ 7 millions de pages Sont ajoutées chaque
jour Sur le réseau
24 25- ne pas prendre pour argent comptant une
information trouvée sur Internet
26- ne pas prendre pour argent comptant une
information trouvée sur Internet
- on ne trouve pas tout sur Internet mais on
trouve de Tout !!
27Pour trouver linformation sur Internet
Par mots clés
Par thème
AltaVista
Yahoo !
Google
28aucun de ces outils ne couvre plus de 20 du Web
visible ! !
- Web visible
- Web invisible
de 200 fois le volume du Web visible !
- les banques de données
- les sites qui nécessitent une identification
préalable - les sites offrant des fichiers dans certains
formats (tableurs, PDF, ) - les sites dont les éditeurs ont décidé
dinterdire leur indexation par un robot (balises
Méta).
29- Principe
- hiérarchie de catégories et de sous-catégories
-
- Cette arborescence est le résultat d un travail
humain !
30- Objectif
- répertorier les sites Web et les classer dans des
catégories thématiques
- Principe
- hiérarchie de catégories et de sous-catégories
- Cette arborescence est le résultat d un travail
humain !
31- Principe de fonctionnement
- le recensement d un site implique une démarche
volontaire de son éditeur
- Modalités de recherche
- pour la plupart 2 modes de consultation
- par rubriques et sous-rubriques
- par saisie de mot(s)
32- répertoires généralistes
- répertoires sélectifs
2 types de répertoires
- les plus connus !
- Nomade
- Open Directory Projet
- Yahoo!
très spécialisés et très ciblés !
33- Répertoire le plus connu
- http//www.yahoo.com/
34(No Transcript)
35Soit recherche hiérarchique dans les catégories
--gt Sciences et technologies gt Biologie gt
Zoologie gt Animaux gt Reptiles et amphibiens gt
Serpents
36Soit en introduisant des mots dans le champ de
saisie
!! en respectant la synthaxe de recherche !!
37Opérateurs booléens ET signe python
monty python ET monty OU
implicite python monty python OU monty
SAUF signe - python -monty python SAUF
monty Recherche dexpressions guillemets
vache folle Expression vache
folle Troncature - joker
38Question python(s) mais pas les Monty Python
39(No Transcript)
40à vos boîtiers
41Sur Yahoo!, quelle formulation de recherche sera
la plus pertinente si vous souhaitez des
informations sur les différentes encéphalopathies
spongiformes transmissibles ?
1. encéphalopathie spongiforme transmissible 2.
encéphalopathie spongiforme transmissible 3.
informations sur les encéphalopathies
spongiformes transmissibles 4. encéphalopathie
spongiforme transmissible
42Qui recense uniquement les informations en
français sur les sites francophones !
43! Nouveau service de Yahoo ! France
lorsque la recherche ne fournit aucun résultat
dans Yahoo ! , la requête est automatiquement
redirigée vers Google
44- Principe
- repose sur la simple recherche de la présence des
mots clés dans les pages dun siteClassement
par pertinence !
45Moteurs de recherche par mots clés
Alta Vista http//www.altavista.com/ Hotbot http
//www.hotbot.com/ Excite http//www.excite.com/
Infoseek http//www.infoseek.com/ Lycos http//
www.lycos.com/ Web Crawler http//www.webcrawler.c
om/ Google http//www.google.com/
46http//www.altavista.com
47(No Transcript)
48Minuscules/majuscules mot saisi en minuscule
toutes les occurences sont recherchées biologie
biologie, Biologie, BIOLOGIE
mot saisi avec une majuscule loccurence exacte
est recherchée Biologie biologie,
Biologie, BIOLOGIE Lettres accentuées prise
en compte de loccurence du mot saisi
lymphoïde lymphoide lymphoide
lymphoide, lymphoïde
49Opérateurs booléens ET signe chat
souris chat ET souris OU
implicite chat souris chat OU souris
SAUF signe - chat -souris chat SAUF
souris Recherche dexpressions guillemets
vache folle expression vache
folle Troncature - joker
50Recherches particulières
Recherche sur un titre de page title Recherche
sur un domaine donné domain Recherche sur le
nom du serveur host Recherche sur une adresse
URL url Recherche sur le texte uniquement text
51questions
52Sur Altavista, pour ne trouver que des sites
belges, comment procéder ?
1. belgique 2. belge 3. domainbe
53Sur Altavista, quelle recherche donnera le plus
grand nombre de résultats ?
1. chien parasitisme 2. parasitisme chien 3.
parasitisme chien 4. parasitisme chien
54Vous recherchez des sites anglophones sur les
prix Nobel en interrogeant Altavista. Comment
poser votre question ?
1. prix Nobel en sélectionnant loption anglais
dans le menu déroulant 2. prix Nobel en
sélectionnant loption anglais dans le menu 3.
prize Nobel en sélectionnant loption anglais
dans le menu 4. Nobel prize en sélectionnant
loption anglais dans le menu 5. aucune de ces
propositions nest correcte 6. toutes les
propositions sont correctes
55Classement des résultats
par pertinence
En pratique les 20 premiers !
56http//www.google.fr http//www.google.com
Son originalité classement des résultats basé
sur le calcul de la popularité des pages
! càd selon le nombre de liens pointant vers
elles sur le réseau ( page bank )
57(No Transcript)
58- moteur qui permetde lancer une requête
simultanément sur - son index ( 2,5 milliards de pages)
- sur le répertoire de sites Web inscrits dans
lOpen Directory
59Opérateurs booléens ET implicite chat
souris chat ET souris chat AND souris chat ET
souris OU OR (en majuscule !) chat OR
souris chat OU souris Recherche dexpressions
guillemets vache folle expression
vache folle Pas de troncature - joker !
60Minuscules/majuscules interprète
indifféremment les majuscules ou les
minuscules Lettres accentuées ne prend pas
en compte les accents ! donc même nombre de
résultats pour lymphoide ou lymphoïde !
61Recherches particulières
Recherche sur un titre de page intitle Recherc
he sur une adresse URL inurl Recherche de
documents au format particulier filetype Re
cherche de pages d un même type related Pages
qui pointent vers une page donnée link
62Recherches particulières
Par exemple linkwww.ulg.ac.be/fmv tous les
sites pointant vers cette URL filetypepdf
chien OR chiens tous les documents en format
PDF traitant de chien(s)
63Description de linformation 1. Nom de la
page 2. Extrait de la page contenant le(s)
terme(s) de la requête 3. Description de la
page 4. Catégories de classement (cf. Open
Directory) 5. URL - taille de la page - date
dindexation de la page
64En cache donne accès à une copie de la page,
telle quelle était le jour où le robot du moteur
la indexée
Pages similaires permet dobtenir un nouvel
écran de résultats, offrant une nouvelle
sélection de pages en rapport avec lURL initiale
65Question
66Vous cherchez de linformation francophone. Quel
répertoire ou moteur ne devrez-vous pas utiliser ?
1. www.altavista.com 2. www.yahoo.com 3.
www.google.fr 4. www.altavista.fr