Pro - PowerPoint PPT Presentation

About This Presentation
Title:

Pro

Description:

Pro irenja invertovano-indeksnih operacija Cvetana Krstev as 4. Odsecanje termina Termini za opis sadr aja mogu se dodeliti upitima i uskladi tenim zapisima u ... – PowerPoint PPT presentation

Number of Views:42
Avg rating:3.0/5.0
Slides: 33
Provided by: Cvet7
Category:

less

Transcript and Presenter's Notes

Title: Pro


1
Proširenja invertovano-indeksnih operacija
  • Cvetana Krstev
  • Cas 4.

2
Odsecanje termina
  • Termini za opis sadržaja mogu se dodeliti upitima
    i uskladištenim zapisima u podsecenom obliku tako
    što se pre dodele termina uklone sufiksi ili
    prefiksi. Ocigledno je da podseceni oblik
    predstavlja širi pojam od originalnog,
    nepodsecenog oblika, jer podseceni termin, u
    stvari, ukljucuje raznovrsne nepodsecene termine.
    Na primer, oblik psych (gde je specijalni znak
    koji predstavlja završetak promenljive dužine)
    reprezentuje psychiatrist, psychiatry,
    psychiatric, psychology, psychologist,
    psychological, i mnoge druge.

3
Metode za podsecanje termina
  • Mogu se koristiti mnoge metode za podsecanje
    termina
  • uklanjanje odredenih sufiksa i prefiksa,
  • uklanjanje fiksnog broja završnih karaktera u
    reci,
  • svodenje svake reci na njen koren fiksne dužine.
  • Obicno se odredeni krajevi reci ili prefiksi
    uklanjaju samo ako pri tome ostaje koren koji je
    dovoljan da identifikuje rec. Tako bi, na primer,
    sufiks -ing bio uklonjen iz termina kakav je
    indexing ali ne i iz termina king.

4
Posecanje sufiksa upitnog termina i invertovani
indeksi
  • Kako se podsecanje termina u upitu uklapa u
    sisteme koji se zasnivaju na tehnologiji
    invertovanog teksta? Ako je u formulaciji upita
    dopušteno samo podsecanje sufiksa prilikom
    postavljanja upita, onda se konvencionalna
    metodologija invertovanih inteksa može zadržati
    jer su liste slogova koje pokrivaju odredeni
    podseceni termini susedni u indeksu. Posebno, za
    dati termin iz upita kakav je PSYCH, može se
    lako generisati kombinovana lista koja se sastoji
    od identifikatora razlicitih slogova iz bilo koje
    liste za obuhvacene, nepodsecene oblike
    (ukljucujuci psychiatrist, psychology, i tako
    dalje.

5
Primer uobicajenog invertovanog indeksa i obrade
upita PSYCH
  • pseudoscience Z1
  • psittacosis Z2
  • psychiatry Z3
  • psychoactive Z2
  • psychoanalysis Z3
  • psychogeriatrics Z4
  • psychology Z3
  • psychometric Z5
  • psychoneuroimmunology Z4
  • psychopathic Z2
  • psychosis Z3
  • psychosomatic Z5
  • psychotherapy Z2
  • puberty Z6

Spojena lista Z2, Z3, Z4, Z5
6
Posecanje prefiksa upitnog termina i invertovani
indeksi
  • U principu se podsecanje prefiksa može uklopiti
    na analogan nacin korišcenjem invertovanih
    indeksa u kojima su termini uredeni u obrnutom
    alfabetskom poretku (s desna na levo). Tako ce se
    rec antisymmetry u indeksu pojaviti kao
    yrtemmysitna dok ce se rec asymmetry slicno
    pojaviti u indeksu kao yrtemmysa. Kada se zada
    upit SYMMETRY, indeks ureden u alfabetskom
    poretku s kraja termina se pretražuje sa
    YRTEMMYS, pa se proces pronalaženja svodi na
    slucaj podsecanja sufiksa.

7
Primer invertovanog indeksa u abecednom poretku s
kraja reci i obrade upita graphy
  • chromatography
  • demography
  • dystrophy
  • electromyography
  • ethnography
  • geography
  • healthy
  • hierarchy
  • mamography
  • onography
  • patriarchy
  • thermography
  • tomography
  • ultrasonography
  • yhcrairtap
  • yhcrareih
  • yhpargoeg
  • yhpargomam
  • yhpargomed
  • yhpargomot
  • yhpargomreht
  • yhpargonhte
  • yhpargono
  • yhpargonosartlu
  • yhpargotamorhc
  • yhpargoymortcele
  • yhportsyd
  • yhtlaeh

8
Opšti problem podsecanja
  • Upitni oblici reci kod kojih su podseceni i
    sufiksi i prefiksi, kao na primer SYMM (koja
    predstavlja i antisymmetric i asymmetry)
    zahtevaju posebna rešenja, na primer kombinovano
    korišcenje invertovanih indeksi termina koji su
    uredeni u alfabetskom poretku i unapred i unazad.
    Da bi se obradili slucajevi infiksnog podsecanja
    potrebna su još složenija rešenja. Na primer,
    upitni termin WOMN bi obuhvatio i termin woman i
    termin women, dok bi upitni termin COLR
    obuhvatio i termin color i colour.

9
Opšte rešenje problema podsecanja upitnih termina
  • Invertovani indeks treba da sadrži sve moguce
    rotirane oblike reci. Takav indeks se može
    formirati na sledeci nacin
  • Svaki termin Xx1x2...xn gde su xi pojedinacni
    karakteri se proširuje dodavanjem specijalnog
    završnog karaktera, na primer kosa crta /
    (karakter koji se nece pojaviti ni u jednoj
    reci)
  • Svaki prošireni termin x1x2...xn/ se ciklicno
    rotira sam oko sebe n1 puta. To proizvodi n1
    razlicitih oblika reci x1x2...xn/, /x1x2...xn,
    xn/x1x2...xn-1, xn-1xn/x1x2...xn-2 i tako dalje.
  • Svakoj tako dobijenoj reci se dopisuje blanko
    karakter
  • Na kraju se dobijena lista oblika reci sortira u
    alfabetskom poretku, pri cemu je poredak
    karaktera u recima blanko,/,a,b,...z.
  • U recniku koji se dobija sada postoji ulaz koji
    može da obradi svaki oblik odsecanja.

10
Primer
Originalni recnik Prošireni ulazi Ciklicno rotirani termini Sortirani ulazi u indeksu
ABC ABC/ /ABC /ABC
BABC BABC/ C/AB /BABC
BCAB BCAB/ BC/A /BCAB
ABC/ AB/BC
/BABC ABC/
C/BAB ABC/B
BC/BA B/BCA
ABC/B BABC/
BABC/ BC/A
/BCAB BC/BA
B/BCA BCAB/
AB/BC C/AB
CAB/B C/BAB
BCAB/ CAB/B

11
Strategija pretraživanja koja identifikuje zapise
koji odgovaraju razlicitim oblicimapodsecenih
termina
  • Za upitni termin X, koji predstavlja nepodsecenu
    karaktersku nisku (traži se sam termin X), biraju
    se ulazi u invertovanom indeksu /X ili X/.
    Odgovarajuci identifikatori zapisa se svi odnose
    na termin X koji je proširen specijalnim
    karakterima / i blanko (predstavljen kao ).
  • Za upitni termin X, (podsecen sufiks) u indeksu
    treba tražiti /X koji odgovara svim ulazima koji
    pocinju sa / (pocetak reci) iza koga sledi X, i
    možda još neki dodatni karakteri. Pronalazi se
    /X, /XY1, /XY2,... koji predstvaljuju termine X,
    XY1, XY2
  • Za upitni termin X (podsecanje prefiksa) treba
    tražiti termin X/ taj termin pronalazi listu
    ulaza X/, X/Y1,...,X/Yn koja predstavlja
    originalni termin X, a zatim i termine
    Y1X,...,YnX koji sadrže proizvoljan prefiks iza
    koga sledi X.
  • Za upitni termin X (podsecen i prefiks i
    sufiks) termin koji se traži je X on pronalazi
    liste ulaza XY1/Z1,...,XYn/Zn koji odgovaraju
    terminima Z1XY1, ...,ZnXYn u kojima je X traženi
    infiks.
  • Za upitni termin XY (podsecanje infiksa) treba
    tražiti termin Y/X, koji pronalazi ulaze
    Y/XZ1,...,Y/XZn, koji odgovaraju terminima
    XZ1Y,...,XZnY gde je Zi infiks promenljive dužine.

12
Primer
  • Sortirani ulazi u indeksu
  • /ABC
  • /BABC
  • /BCAB
  • AB/BC
  • ABC/
  • ABC/B
  • B/BCA
  • BABC/
  • BC/A
  • BC/BA
  • BCAB/
  • C/AB
  • C/BAB
  • CAB/B
  • Originalni upitni termin B
  • Termin za traženje B
  • Pronadeni termin
  • B/BCA
  • BABC/
  • BC/A
  • BC/BA
  • BCAB/
  • Odgovarajuci originalni termini
  • BCAB
  • BABC
  • ABC
  • BABC
  • BCAB

13
Prednosti i nedostaci ovog rešenja
  • Neki termini se javljaju više puta u izlaznoj
    listi (a time i zapisi koji odgovaraju tim
    terminima) ako se traženi segment pojavljuje više
    puta u pronadenom terminu, što se u realnim
    primerima retko dogada (na primer, BABC i BCAB se
    javljaju dva puta u izlaznoj listi zbog
    dvostrukog pojavljivanja traženog B).
  • Metod permutovanog recnika omogucava da se
    podseceni termini koriste u formulacijama upita
    ali po cenu znatnog povecavanja broja stavki u
    indeksu. Liste identifikatora zapisa koje
    odgovaraju razlicitim ulazima u indeks, kao i
    sami zapisi, ne moraju da se dupliraju.

14
Realan primer - 1
  • D1 Kad krompir bude obaren, treba ocediti vodu i
    ostaviti poklopljen krompir na kraj štednjaka da
    se dokuva u pari.
  • D2 Kada sam bio u "Partizanu", pre osam godina,
    došao sam na "ludu" ideju da iskuvam peškire i
    caršave.
  • D3 Grgec se kuva, a može se i pržiti.
  • D4 Medu gastronomima je dobro poznato uputstvo,
    u praksi potvrdeno - kuvaj regionalno, slavice te
    planetarno.
  • D5 On je posredno optužio jordanskog suverena
    zbog tvrdnje da je Irak nameravao da napadne
    Kuvajt i Jordan.
  • D6 Bio je pomorac, kuvar na brodu, i u periodu
    od 1958. do 1964. godine, krstario svetskim
    morima.
  • D7 Stepenište koje vodi u nju je opasno za tu
    tako cesto trudnu ženu, ali ona pravi jelovnik i
    proverava kuvaricinu knjigu racuna rasporeduje
    cvece u vaze, bira ili otpušta poslugu.
  • D8 Ne samo komandantsko no i kaldrmdžisko -
    parakuvarsko oduševljenje popustilo ga je.
  • D9 Poneko ostavlja na stolu debelu knjigu kojoj
    se namerava vratiti pošto skuva caj
  • D10 Tacnije, sve je, izgleda, zakuvao bivši
    ministar finansija.
  • D11 Pribeglo se, kaže on, formiranju tela koje
    je služilo samo za paradu.

15
  • Originalni termini
  • dokuva/
  • iskuvam/
  • kuva/
  • kuvaj/
  • kuvajt/
  • kuvar/
  • kuvaricinu/
  • parakuvarsko/
  • skuva/
  • zakuvao/
  • paradu/
  • Rotirani termini
  • dokuva/, /dokuva, a/dokuv, va/doku, uva/dok,
    kuva/do, okuva/d
  • iskuvam/, /iskuvam, m/iskuva, am/iskuv, vam/isku,
    uvam/isk, kuvam/is, skuvam/i
  • kuva/, /kuva, a/kuv, va/ku, uva/k
  • kuvaj/, /kuvaj, j/kuva, aj/kuv, vaj/ku, uvaj/k
  • kuvajt/, /kuvajt, t/kuvaj, jt/kuva, ajt/kuv,
    vajt/ku, uvajt/k
  • kuvar/, /kuvar, r/kuva, ar/kuv, var/ku, uvar/k
  • kuvaricinu/, /kuvaricinu, u/kuvaricin,
    nu/kuvarici, inu/kuvaric, icinu/kuvar,
    ricinu/kuva, aricinu/kuv, varicinu/ku,
    uvaricinu/k
  • parakuvarsko/, /parakuvarsko, o/parakuvarsk,
    ko/parakuvars, sko/parakuvar, rsko/parakuva,
    arsko/parakuv, varsko/paraku, uvarsko/parak,
    kuvarsko/para, akuvarsko/par, rakuvarsko/pa,
    arakuvarsko/p
  • skuva/, /skuva, a/skuv, va/sku, uva/sk, kuva/s
  • zakuvao/, /zakuvao, o/zakuva, ao/zakuv, vao/zaku,
    uvao/zak, kuvao/za, akuvao/z
  • paradu/, /paradu, u/parad, du/para, adu/par,
    radu/pa, aradu/p

16
ricinu/kuva D7 rsko/parakuva D8 sko/parakuvar
D8 skuva/ D9 skuvam/i D2 t/kuvaj D5 u/kuvaricin
D7 u/parad D11 uva/dok D1 uva/k D3 uva/sk
D9 uvaj/k D4 uvajt/k D5 uvam/isk D2 uvao/zak
D10 uvar/k D6 uvaricinu/k D7 uvarsko/parak
D8 va/doku D1 va/ku D3 va/sku D9 vaj/ku
D4 vajt/ku D5 vam/isku D2 vao/zaku D10 var/ku
D6 varicinu/ku D7 varsko/paraku D8 zakuvao/ D10
  • Konacan indeks
  • /dokuva D1
  • /iskuvam D2
  • /kuva D3
  • /kuvaj D4
  • /kuvajt D5
  • /kuvar D6
  • /kuvaricinu D7
  • /paradu D11
  • /parakuvarsko D8
  • /skuva D9
  • /zakuvao D10
  • a/dokuv D1
  • a/kuv D3
  • a/skuv D9
  • adu/par D11
  • aj/kuv D4
  • ajt/kuv D5
  • akuvao/z D10
  • du/para D11
  • icinu/kuvar D7
  • inu/kuvaric D7
  • iskuvam/ D2
  • j/kuva D4
  • jt/kuva D5
  • ko/parakuvars D8
  • kuva/ D3
  • kuva/do D1
  • kuva/s D9
  • kuvaj/ D4
  • kuvajt/ D5
  • kuvam/is D2
  • kuvao/za D10
  • kuvar/ D6
  • kuvaricinu/ D7
  • kuvarsko/para D8
  • m/iskuva D2
  • nu/kuvarici D7

Upit kuvar
Upitni termin kuvar/
Pronadeno u indeksu kuvar/
Odgovara terminu kuvar
Pronadena dokumenta D6
17
ricinu/kuva D7 rsko/parakuva D8 sko/parakuvar
D8 skuva/ D9 skuvam/i D2 t/kuvaj D5 u/kuvaricin
D7 u/parad D11 uva/dok D1 uva/k D3 uva/sk
D9 uvaj/k D4 uvajt/k D5 uvam/isk D2 uvao/zak
D10 uvar/k D6 uvaricinu/k D7 uvarsko/parak
D8 va/doku D1 va/ku D3 va/sku D9 vaj/ku
D4 vajt/ku D5 vam/isku D2 vao/zaku D10 var/ku
D6 varicinu/ku D7 varsko/paraku D8 zakuvao/ D10
  • Konacan indeks
  • /dokuva D1
  • /iskuvam D2
  • /kuva D3
  • /kuvaj D4
  • /kuvajt D5
  • /kuvar D6
  • /kuvaricinu D7
  • /paradu D11
  • /parakuvarsko D8
  • /skuva D9
  • /zakuvao D10
  • a/dokuv D1
  • a/kuv D3
  • a/skuv D9
  • adu/par D11
  • aj/kuv D4
  • ajt/kuv D5
  • akuvao/z D10
  • du/para D11
  • icinu/kuvar D7
  • inu/kuvaric D7
  • iskuvam/ D2
  • j/kuva D4
  • jt/kuva D5
  • ko/parakuvars D8
  • kuva/ D3
  • kuva/do D1
  • kuva/s D9
  • kuvaj/ D4
  • kuvajt/ D5
  • kuvam/is D2
  • kuvao/za D10
  • kuvar/ D6
  • kuvaricinu/ D7
  • kuvarsko/para D8
  • m/iskuva D2
  • nu/kuvarici D7

Upit kuvaj
Upitni termin /kuvaj
Pronadeno u indeksu /kuvaj, /kuvajt
Odgovara terminima kuvaj, kuvajt
Pronadena dokumenta D4, D5
18
ricinu/kuva D7 rsko/parakuva D8 sko/parakuvar
D8 skuva/ D9 skuvam/i D2 t/kuvaj D5 u/kuvaricin
D7 u/parad D11 uva/dok D1 uva/k D3 uva/sk
D9 uvaj/k D4 uvajt/k D5 uvam/isk D2 uvao/zak
D10 uvar/k D6 uvaricinu/k D7 uvarsko/parak
D8 va/doku D1 va/ku D3 va/sku D9 vaj/ku
D4 vajt/ku D5 vam/isku D2 vao/zaku D10 var/ku
D6 varicinu/ku D7 varsko/paraku D8 zakuvao/ D10
  • Konacan indeks
  • /dokuva D1
  • /iskuvam D2
  • /kuva D3
  • /kuvaj D4
  • /kuvajt D5
  • /kuvar D6
  • /kuvaricinu D7
  • /paradu D11
  • /parakuvarsko D8
  • /skuva D9
  • /zakuvao D10
  • a/dokuv D1
  • a/kuv D3
  • a/skuv D9
  • adu/par D11
  • aj/kuv D4
  • ajt/kuv D5
  • akuvao/z D10
  • du/para D11
  • icinu/kuvar D7
  • inu/kuvaric D7
  • iskuvam/ D2
  • j/kuva D4
  • jt/kuva D5
  • ko/parakuvars D8
  • kuva/ D3
  • kuva/do D1
  • kuva/s D9
  • kuvaj/ D4
  • kuvajt/ D5
  • kuvam/is D2
  • kuvao/za D10
  • kuvar/ D6
  • kuvaricinu/ D7
  • kuvarsko/para D8
  • m/iskuva D2
  • nu/kuvarici D7

Upit kuva
Upitni termin kuva/
Pronadeno u indeksu kuva/, kuva/do, kuva/s
Odgovara terminima kuva, dokuva, skuva
Pronadena dokumenta D1, D3, D9
19
ricinu/kuva D7 rsko/parakuva D8 sko/parakuvar
D8 skuva/ D9 skuvam/i D2 t/kuvaj D5 u/kuvaricin
D7 u/parad D11 uva/dok D1 uva/k D3 uva/sk
D9 uvaj/k D4 uvajt/k D5 uvam/isk D2 uvao/zak
D10 uvar/k D6 uvaricinu/k D7 uvarsko/parak
D8 va/doku D1 va/ku D3 va/sku D9 vaj/ku
D4 vajt/ku D5 vam/isku D2 vao/zaku D10 var/ku
D6 varicinu/ku D7 varsko/paraku D8 zakuvao/ D10
  • Konacan indeks
  • /dokuva D1
  • /iskuvam D2
  • /kuva D3
  • /kuvaj D4
  • /kuvajt D5
  • /kuvar D6
  • /kuvaricinu D7
  • /paradu D11
  • /parakuvarsko D8
  • /skuva D9
  • /zakuvao D10
  • a/dokuv D1
  • a/kuv D3
  • a/skuv D9
  • adu/par D11
  • aj/kuv D4
  • ajt/kuv D5
  • akuvao/z D10
  • du/para D11
  • icinu/kuvar D7
  • inu/kuvaric D7
  • iskuvam/ D2
  • j/kuva D4
  • jt/kuva D5
  • ko/parakuvars D8
  • kuva/ D3
  • kuva/do D1
  • kuva/s D9
  • kuvaj/ D4
  • kuvajt/ D5
  • kuvam/is D2
  • kuvao/za D10
  • kuvar/ D6
  • kuvaricinu/ D7
  • kuvarsko/para D8
  • m/iskuva D2
  • nu/kuvarici D7

Upit skuva
Upitni termin skuva
Pronadeno u indeksu skuva/, skuvam/i
Odgovara terminima skuva, iskuvam
Pronadena dokumenta D2, D9
20
Realan primer - 2
  • D1 A ako ovako potraje, ja ni tri meseca necu
    izdržati, za tri meseca necu moci da izdam platu
    ni onima što zaista rade.
  • D2 Tako, na primer, posmatrajuci list uocavamo
    njegov spoljašnji oblik, velicinu, izgled oboda i
    nerava.
  • D3 Operem ga i ceo patos izribam.
  • D4 Iz definicije neposredno sledi da je
    izomorfizam poliedara relacija ekvivalencije.
  • D5 Sad su i po rukama. Imam kratke rukave.
    Zavlace se i ispod rukava.
  • D6 Povukoh vodu i rekoh sažaljivo, kao da
    osudenom izbijam stolicu ispod nogu "Davi se."

21
  • Originalni termini
  • izbijam/
  • izdam/
  • izgled/
  • imam/
  • izribam/
  • izomorfizam/
  • Rotirani termini
  • izbijam/, /izbijam, m/izbija, am/izbij, jam/izbi,
    ijam/izb, bijam/iz, zbijam/i
  • izdam/, /izdam, m/izda, am/izd, dam/iz, zdam/i
  • izgled/, /izgled, d/izgle, ed/izgl, led/izg,
    gled/iz, zgled/i
  • imam/, /imam, m/ima, am/im, mam/i
  • izribam/, /izribam, m/izriba, am/izrib, bam/izri,
    ibam/izr, ribam/iz, zribam/i
  • izomorfizam/, /izomorfizam, m/izomorfiza,
    am/izomrofiz, zam/izomorfi, izam/izomorf,
    fizam/izomor, rfizam/izomo, orfizam/izom,
    morfizam/izo, omorfizam/iz, zomorfizam/i

22
  • Konacan indeks
  • /imam D5
  • /izbijam D6
  • /izdam D1
  • /izgled D2
  • /izomorfizam D4
  • /izribam D3
  • am/im D5
  • am/izbij D6
  • am/izd D1
  • am/izomrofiz D4
  • am/izrib D3
  • bam/izri D3
  • bijam/iz D6
  • d/izgle D2
  • dam/iz D1

Upit izam
ed/izgl D2 fizam/izmorf D4 gled/iz D2 ibam/izr
D3 ijam/izb D6 imam/ D5 izam/izomorf D4 izbijam/
D6 izdam/ D1 izgled/ D2 izomorfizam/ D4 izribam/
D3 jam/izbi D6 led/izgl D2 m/ima D5 m/izbija D6
m/izda D1 m/izomorfiza D4 m/izriba D3 mam/I
D5 morfizam/izo D4 omorfizam/iz D4 orfizam/izom
D4 rfizam/izomo D4 ribam/iz D3 zam/izomorfi
D4 zbijam/i D6 zdam/i D1 zgled/i D2 zomorfizam/I
D4 zribam/i D3
Upitni termin am/iz
Pronadeno u indeksu am/izbij, am/izd,
am/izomorfiz, am/izrib
Odgovara terminima izbijam, izdam, izomorfizam,
izribam
Pronadena dokumenta D1, D3, D4, D6
23
Regulisanje velicine izlaza bulovskih upita
  • Standardno korišcenje bulovskih formulacija upita
    može da postavlja mnogo problema korisnicima jer
    je izlaz pretrage osetljiv na formulaciju upita,
    i može ozbiljno da varira sa veoma malim
    promenama u formulaciji upita. Osim toga,
    nedostatak jednostavne kontrole nad velicinom
    izlaza i proizvodnja rezultata pretrage koji nisu
    ni na koji nacin rangirani prema nekoj
    pretpostavljenoj koristi za korisnika, komplikuje
    pretragu za mnoge neobucene korisnike. Mnoge
    metode su razvijene koje pojednostavljuju
    operacije pretrage, a u isto vreme zadržavaju
    tehnogiju pretraživanja utemeljenu na bulovskim
    formulacijama upita i na standardnim metodama
    objedinjavanja lista.

24
Sistem sa pronalaženjem na željenom nivou
  • Kod ovakvog pronalaženja, originalni bulovski
    upit koji sadrži n termina se zamenjuje novim
    upitom koji je izabran iz liste Bulovskih upita
    od istih n termina, a koji variraju od vrlo uskih
    formulacija gde je svih n termina ukljuceno u
    jedan and iskaz
  • (A and B and ...)
  • do veoma širokih formulacija gde je svih n
    termina ukljuceno u jedan or iskaz
  • (A or B or ...).
  • Medu-upiti se sastoje, prvo od disjunkcije n and
    iskaza, pri cemu je svaki od ovih n iskaza
    dobijen od najuže formulacije brisanjem iz nje
    jednog clana. Sledeca formulacija je još
    opuštenija i sastoji se od disjunkcije and iskaza
    koji su iz najuže formulacije dobijeni brisanjem
    dva clana, i tako redom, dok se ne dode do and
    iskaza koji imaju samo po jedan clan.

25
Primer Hijerarhija upita sa cetiri upitna
termina A, B, C, D
Broj upita Hijerarhija upita (od najužeg do najšireg) Broj prona- denih Broj prona-denih rele-vantnih
0 (A ? B ? C ? D) 2 2
1 (A ? B ? C) ? (A ? B ? D) ? (A ? C ? D) ? (B ? C ? D) 6 5
2 (A ? B) ? (A ? C ) ? (A ? D) ? (B ? C) ? (B ? D) ? (C ? D) 23 15
3 (A ? B ? C ? D) 86 25
26
Pretraživanje COBISS kataloga Narodne in
univerzitetne knjižnice u Ljubljani
  • Pretraživanje s kljucevima
  • AUAndric autor Andric
  • PY1988 - godina izdanja 1988
  • TIavlija naslov dela se završava sa avlija
  • PUProsveta izdavac Prosveta

27
(AUAndric) AND (PY1988) AND (TIavlija) AND (PUProsveta) 2 2 prozor_1
((AUAndric) AND (PY1988) AND (TIavlija)) OR ((AUAndric) AND (PY1988) AND (PUProsveta)) OR ((AUAndric) AND (TIavlija) AND (PUProsveta)) OR ((PY1988) AND (TIavlija) AND (PUProsveta)) 11 10 prozor_2
((AUAndric) AND (PY1988)) OR ((AUAndric) AND (PUProsveta)) OR ((AUAndric) AND (TIavlija)) OR ((PUProsveta) AND (TIavlija)) OR ((PY1988) AND (PUProsveta)) OR ((TIavlija) AND (PY1988)) 205 ?(4/30)20527 prozor_3
(AUAndric) OR (PY1988) OR (TIavlija) OR (PUProsveta) 34044 ? prozor_4
dalje
28
(AUAndric) AND (PY1988) AND (TIavlija) AND
(PUProsveta) nazad
29
((AUAndric) AND (PY1988) AND (TIavlija)) OR
((AUAndric) AND (PY1988) AND (PUProsveta)) OR
((AUAndric) AND (TIavlija) AND (PUProsveta))
OR ((PY1988) AND (TIavlija) AND
(PUProsveta)) nazad
30
((AUAndric) AND (PY1988)) OR ((AUAndric) AND
(PUProsveta)) OR ((AUAndric) AND (TIavlija))
OR ((PUProsveta) AND (TIavlija)) OR ((PY1988)
AND (PUProsveta)) OR ((TIavlija) AND
(PY1988)) nazad
31
(AUAndric) OR (PY1988) OR (TIavlija) OR
(PUProsveta) nazad
32
Odnos širine upita i broja pronadenih dokumenata
  • U hijerarhiji upita kakva je prikazana u
    prethodnim primerima može se ocekivati da broj
    pronadenih dokumenata raste sa širinom upita.
    Korisnik tada može da izabere formulaciju iz
    hijerahije upita koja izdvaja onoliko dokumenata
    koliko odgovara njegovim potrebama i
    mogucnostima. Kada je izabrani upit veoma uzak,
    ukupan broj pronadenih stavki bice mali, ali ce
    najveci broj njih biti relevantan. S druge
    starne, kod širokih upita izlaz je veliki, ali
    može se ocekivati da ce deo relevantnih
    dokumenata medu svim izdvojenim biti mnogo manji.
Write a Comment
User Comments (0)
About PowerShow.com