Cercare informazioni sul Web - PowerPoint PPT Presentation

About This Presentation
Title:

Cercare informazioni sul Web

Description:

Cercare informazioni sul Web Organizzazione dell informazione tramite gerarchie Classificazione gerarchica L informazione raggruppata in un piccolo numero di ... – PowerPoint PPT presentation

Number of Views:92
Avg rating:3.0/5.0
Slides: 22
Provided by: unim210
Category:

less

Transcript and Presenter's Notes

Title: Cercare informazioni sul Web


1
Cercare informazioni sul Web
2
Organizzazione dellinformazione tramite gerarchie
  • Classificazione gerarchica
  • Linformazione è raggruppata in un piccolo numero
    di categorie, ognuna descritta semplicemente
    (classificazione di primo livello)
  • Linformazione in ogni categoria è suddivisa in
    sotto-categorie (classificazione di secondo
    livello), e così via
  • Alla fine le classificazioni saranno così piccole
    che sarà possibile scorrere unintera categoria
    per trovare linformazione desiderata

3
(No Transcript)
4
Caratteristiche importanti delle classificazioni
  • Le descrizioni devono coprire tutte le
    informazioni categorizzate e facilitare eventuali
    ricerche.
  • Le sotto-categorie non devono usare tutte la
    stessa classificazione.
  • Linformazione contenuta in una categoria
    definisce il modo migliore di classificarla.
  • Non cè un modo univoco di classificare
    linformazione.

5
Progettare una gerarchia
  • Regole generali per la progettazione delle
    gerarchie e terminologia
  • la radice è posta in alto
  • "salire lungo la gerarchia significa che la
    classificazione diventa più inclusiva (insiemi
    vasti di elementi più generici)
  • "scendere lungo la gerarchia che la
    classificazione diventa più specifica
  • il simbolo di maggiore (gt) è usato comunemente
    per indicare la navigazione verso il basso lungo
    la gerarchia

6
Livelli in una gerarchia
  • Una gerarchia a un livello non ha sotto-directory
  • Per contare i livelli, occorre ricordare che
  • cè sempre una radice
  • ci sono sempre foglie - le categorie stesse
  • la radice e le foglie non contano come livelli
  • I gruppi si possono sovrapporre (un elemento può
    apparire in più categorie) o essere partizionati
    (ogni categoria appare solo una volta)
  • Il numero dei livelli può variare a seconda delle
    categorie

7
(No Transcript)
8
(No Transcript)
9
(No Transcript)
10
Ottenere informazioni con una ricerca sul Web
  • Come funziona un motore di ricerca
  • È costituito da due parti principali
  • Crawler visita i siti Internet, seguendo i
    collegamenti e costruendo un indice del contenuto
    del Web
  • Query processor cerca nellindice le occorrenze
    delle parole chiave inserite dallutente e
    restituisce le pagine web che le contengono
  • I motori di ricerca più famosi sono Google,
    Yahoo!, Alta Vista, Excite e InfoSeek

11
(No Transcript)
12
I crawler
  • Quando un crawler visita un sito web
  • Per prima cosa identifica tutti i link che
    puntano ad altre pagine
  • Controlla di non aver visitato recentemente
    queste pagine
  • Se non è così, le aggiunge a una lista di pagine
    da processare
  • Memorizza in un indice tutte le parole chiave
    utilizzate nella pagina

13
Elaboratori di interrogazioni
  • Riceve alcune parole chiave dallutente e le
    cerca nellindice
  • Anche se la pagina non è stata ancora esaminata
    dal crawler, potrebbe comunque essere presente
    perché collegata con un link a una pagina già
    considerata

14
Page ranking
  • Unidea di Google PageRank
  • Ordina i link secondo la rilevanza
  • La rilevanza è calcolata in base al numero di
    collegamenti che puntano alla pagina (più link
    puntano alla pagina, più essa è importante)
  • ogni collegamento a una pagina è considerato un
    "voto" per quella pagina
  • Google considera anche il ranking della pagina
    che sta votando

15
Formulare la domanda giusta
  • Scegliere le parole giuste e sapere come il
    motore di ricerca le userà
  • Parole o frasi?
  • i motori di ricerca generalmente considerano ogni
    parola separatamente
  • per cercare una frase esattamente comè scritta
    possiamo racchiuderla tra virgolette

16
Operatori logici
  • AND, OR, NOT
  • AND dice al motore di ricerca di restituire
    solo le pagine che contengono entrambe le parole
  • tailandese AND ristorante
  • OR dice al motore di ricerca di trovare le
    pagine che contengono una parola o laltra, e
    ovviamente anche quelle che le contengono
    entrambe
  • NOT esclude le pagine che contengono una data
    parola
  • NOT è un operatore prefisso va messo prima della
    parola da escludere

17
(No Transcript)
18
Cinque consigli per una ricerca efficace
  • Definite chiaramente quale tipo di pagina state
    cercando (unorganizzazione, unazienda, una
    pagina di riferimento ecc.)
  • Cercate di immaginare quale tipo di
    organizzazione potrebbe pubblicare la pagina che
    desiderate.
  • Potreste essere in grado di indovinare lURL
  • Elencate i termini che hanno la maggiore
    probabilità di comparire nella pagina che state
    cercando.
  • Valutate i risultati
  • Prima di esaminare le pagine, valutate
    lefficacia della ricerca
  • Considerate una strategia in due passate.
  • Fate una ricerca ad ampio raggio e poi
    selezionate i risultati

19
Quanto è affidabile il Web?
  • Chiunque può pubblicare sul Web ciò che vuole
  • Molta dellinformazione disponibile è falsa,
    fuorviante, ingannevole, faziosa, diffamatoria o
    disgustosa
  • Come facciamo a sapere se le pagine che troviamo
    sono affidabili?

20
Non date nulla per scontato
  • I nomi dei domini registrati possono essere
    ingannevoli o intenzionalmente truffaldini
  • Occorre verificare lidentità della persona o
    dellorganizzazione che pubblica la pagina web

21
Caratteristiche dei siti affidabili
  • I siti web risultano più credibili se hanno
    queste caratteristiche
  • Esistenza reale nel mondo fisico. Il sito
    fornisce un indirizzo, numero di telefono e
    indirizzo di posta elettronica.
  • Certificazione. Il sito include riferimenti,
    citazioni o credenziali, nonché collegamenti a
    siti altrettanto certificati.
  • Chiarezza. Il sito è ben organizzato, facile da
    navigare e fornisce servizi come una ricerca
    interna.
  • Aggiornamento. Il sito è stato aggiornato di
    recente.
  • Professionalità. La grammatica, lortografia, la
    punteggiatura e laspetto grafico sono corretti
    tutti i link funzionano.
  • Tenete presente che un sito potrebbe esibire
    tutte queste qualità ed essere tuttavia non
    autorizzato
Write a Comment
User Comments (0)
About PowerShow.com