Title: Vyhled
1Vyhledávání v prostredí internetu
- Barbora Poláková Martin Kozel
2(No Transcript)
3Osnova prednášky
- Co se deje?
- zmeny v prístupu a práci s informacemi
- Co s tím ?
- Struktura informací na webu teorie a praxe
- Jak na to ?
- Strategie vyhledávání a postupy
4Informace
- Komunikovatelný popis jevu, jehož prijetím
dochází ke zmenám v informacním systému. - Odstranená ENTROPIE
- ?Vyšší míra usporádanosti
- Cím více neurcitosti odstraní tím vetší má
informace hodnotu. (Shannon,1948) - popsatelná
- kontextove nezávislá
- organizovatelná
- informacní zdroj/pramen
5Informacní spolecnost
- je taková spolecnost, ve které je venována
pozornost informacní cinnosti natolik, že dojde
ke snížení zájmu o zemedelskou a prumyslovou
výrobu (Vlasák, 2000) - Marc Uri Porat (1976). Information economy
definition and measurement - 70.léta postindustriální spolecnost
- prumysl ----- gt služby
6- 80.léta informacní spolecnost
- propojení pocítacového prumyslu s ostatními
prumyslovými odvetvími - rozvoj informacní a pocítacové GRAMOTNOSTI
- INFORMACNÍ SEKTOR profese tvorby, sberu,
zpracovávání, uchovávání, zpetného vyhledávání a
dalšího šírení informací (Vlasák, 2000)
7Informacní exploze
- Informace Moc Peníze !!!
- Prudký rozvoj informacních technologií a jejich
dostupnost - KVANTITATIVNÍ nárust informací a informacních
zdroju - Redundance relevance pertinence
- Mrtvá data long tail effect
8Informacní smog (Shenk 1997)
- lidstvo se nevyvíjí dost rychle aby zvládalo
množství informací - Exformace - informace existující za hranicemi
našeho vedomí (Gore, 1994) - Zahlcení
- snížení citlivosti k obsahu - mozková kapacita
je stále stejná (Cernohlávková, 2006)
9Znalostní spolecnost
- nadstavba informacní spolecnosti založená na
kolaboraci a interakci mezi uživateli - Web 2.0 - Tim Bernards-Lee (2000)
- Znalost
- kontextove závislá pragmatický obraz informace
reprezentovaný intelektuálním kapitálem
jednotlivce (Bukh, 2001)
10Terminologické vyjasnení
- Základní abstraktní pojmy
- INFORMACE
- ZNALOSTI
- Základní konkrétní pojmy
- Informacní / elektronický zdroj
- digitální / informacní objekt / entita
11Publikacní procesy
12Publikacní proces informacního zdroje - puvodní
Nakladatelství, casopisy, databáze, databázová
centra
13Publikacní proces informacního zdroje nyní
Web 2.0 sociální síte, wiki, blog
14Hodnocení
-
- Aktuálnost
- Rychlost
- Kooperace
- -
- Kontrola kvality, relevance
- Korektura
- Odborný dohled
- Distribuce a popis jsou na autorovi
NEDOHLEDATELNOST
15KDE TO VŠECHNO MUŽEME NAJÍT ?
16World Wide Web
- Viditelný / povrchový web
- informacní entity volne prístupné a snadno
dostupné pomocí vyhledávacích stroju - Neviditelný / hluboký web
- neviditelný pro bežné vyhledavace
- databáze, adresáre, rejstríky, dokumenty v
nepodporovaných formátech, licencované stránky - 500x vetší než povrchový web
17Web povrchový a hluboký (Bergman,2001)
18Obsahové rozvrstvení hlubokého webu (Bergman,
2001)
19CO TAM MUŽEME NAJÍT ?
20Digitální objekt (DO)
- základní entita
- Hledisko puvodu
- digitalizované informacní zdroje
- E-book postprinty
- born digital
- Webové stránky, fóra, komunity, blogy, wiki
21Hledisko typu DO
- MIME - Multipurpose Internet Mail Extension
- Specifikuje charakter obsahu oficiálne
komunikovaných DO na internetu - Typy
- Text
- Obraz
- Video
- Zvuk
- Software
- Trojrozmerné digitální objekty
22Digitální objekt
Hlavicka / Metadata
Obsah
Podpis
23Metadata Velká a mocná
- Data o datech
- Strukturované informace, které popisují,
osvetlují, lokalizují a usnadnují vyhledávání a
využívání informacního zdroje. (Guidlines for
Digitalization, 2007)
24Popis DO
- Predobraz metadatového popisu je v popisu
tradicních zdroju. - strojem citelný X stroji srozumitelný
-
- Dve úrovne popisu
- vecná obsah, anotace, abstrakt, klícová slova,
kódy systematického trídení - popisná popis dokumentu podle formálních znaku
autor, název, vydavatel, rok vyd.
25Tradicní bbg. Záznam - MARC 21
26Dublin Core Metadata Initiative -DCMI
- Dublin Core
- Soubor 15 metadatových kvalifikovatelných prvku
- Puvodne popis zdroju na WWW soucasne popis
jakéhokoli objektu - Garant popisu - autor ? user-friendly
- Dublin Core Czech
- DCMI homepage
27Prvky DC
- Název
- Tvurce
- Predmet
- Popis
- Vydavatel
- Prispevatel
- Datum
- Typ zdroje
- Formát
- Identifikátor
- Zdroj
- Jazyk
- Vztah
- Pokrytí
- Práva
28Identifikátory
- URL
- Adresa DO urcuje pozici DO v prostredí webu
- URN
- Znakový retezec nebo císlo, které jednoznacne
identifikuje dokument - Trvalé, neprenosné
- Generátory metadat
- XML soubory
29Metadata - DC
30TAK JSME TO HEZKY POPSALI A JAK TO NAJDEM?
31Vyhledávací nástroje HLAVORUCNÍ
- Predmetové katalogy - directories-
- Seznam katalog, Yahoo katalog
- trídení a organizace DO podle predem dané
taxonomie nebo predmetové klasifikace - Nejpodobnejší tradicním knihovnám
- Lidský faktor
- Malé pokrytí, úplnost taxonomie
32Vyhledávací nástroje AUTOMATICKÉ
- Vyhledavace - search engine
- Altavista
- Metavyhledavace
- víc indexu najednou
- Open Text
- Sekvencní analýza
- Automatická INDEXACE digitálních objektu za
pomoci speciálního softwaru - Robot crawler spiders bot
- Index reprezentace fondu úplných textu -
metadata
33Vyhledavac obecné schéma
Vyhledavac
Prostredí webu
(Poláková, 2009)
34Google Schéma (Brin Page, 2000)
35Uživatelské rozhraní 1/2 Textové
- Textový vyhledávací dotaz
- Textová reprezentace výsledku
- Index zkrácená informace o príslušném zdroji
- odkaz na fulltext
- Google
36Question answering 2/2
37Uživatelské rozhraní 1/3 Clustry
- Vektorová logika
- Vážení podobnosti dokumentu s dotazy relevance
- Informacní prostor soubor prvku a vztahu mezi
nimi udržovaných informacním systémem (Ingwersen
1996)
38Clustry 2/3v informacním prostoru
(Traykovski Sosisk, 2007)
39Clusty.com 3/3
40Uživatelské rozhraní 1/3 Vizuální
41Carrot2 2/3
42Searchme 3/3
43Strategie vyhledávání
44Základní princip
CO?
KDE?
JAK?
45Co chci najít?
- Informacní potreba
- to co vím mi nestací
- Požadavek
- konkretizovaná predstava o informacní potrebe
- Dotaz
- Kladu prímo zdroji, ve kterém hledám
- Ve vyhledávacích obecne
- navigacní, informacní, transakcní (napr. co,
kdy, kde atd.)
46Informacní potreba
- V 80-90 letech se rozvíjí veda nazvaná
informacní chování uživatele - Posun v prístupu
- computer-centred gt user-centred
- Tri základní prístupy
- Kognitivní
- Sociální
- Sociokognitivní (nejvíc in, kombinace
individualismu s kontextualitou prostredí)
47KDE
- Typ zdroje
- Primární zdroje
- Sekundární zdroje
- Terciální zdroje
- Vyhledavace, katalogy, databáze, encyklopedie
- Globální / lokální charakter, Gatekeeping
48JAK
- Vychytávky
- Boolean logika (AND, OR, NOT )
- Proximitní operátory (NEAR, WITHIN, SAME, )
- Lematizace (sklonování, ?, atd.)
- Typy vyhledávání
- Fulltextové
- Faktografické
- Atd.
- Rešeršní strategie
49JAK
- ANALYTICKÉ VYHLEDÁVÁNÍ
- Systematická strategie
- Príprava, promýšlení problému, preddotazy
- PROHLÍŽENÍ (browsing)
- Intuitivní vyhledávání
50ZPETNÁ VAZBA
51REŠERŠNÍ STRATEGIE
- Základní kameny
- Rostoucí perla
- Osekávání
52Literatura
- GORE, Albert. Zeme na misce vah. 1.vyd. Praha
Argo, 1994, ISBN 80-85794-21-7. str.186. - CERNOHLÁVKOVÁ, Katerina. Informacní hygiena. Brno
Masarykova Univerzita, 2006. - SHENK, David. Data Smog Surviving the
Information Glut. 1 st ed. San Francisco Harper
Edge,1997. 250 s. ISBN 0060187018. - ARMS, W. Key Concepts in the Architecture of the
Digital Library. D-Lib Magazine online. July
1995 cit. 2007-10-22. Dostupný z WWW lt
http//www.dlib.org/dlib/July95/07arms.htmlgt.
ISSN 1082-9873. - Brin S., Page, L. The Anatomy of a Large-Scale
Hypertextual Web Search Engine. Stanford
University online 2000 cit. 2010-03-22.
Dostupný z WWW http//infolab.stanford.edu/backr
ub/google.html - SKLENÁK (2000). Data informace znalosti
- BUKH, P.N. Larsen H.T., Mouritsen J. (2001)
Constructing intellectual capital statements.
Scandinavian Journal of managemennt roc. 17, s.
87-108
53Literatura
- VLASÁK, R. (2000). Informacní povolání a
informacní spolecnost - PILECKÁ, Vera Kognitivní aspekty vyhledávání.
Dostupný z WWW lthttp//www.ikaros.cz/node/3592gt. - Pilecká, Vera (2010) Kognitivní prístupy k
vyhledávání informací. Praha Univerzita
Karlova. - Mírková, Miluše (2009) Bibliografická a rešeršní
cinnost. Dostupný z WWW http//home.czu.cz/mirko
va/ - Portál pro podporu informacní gramotnosti
www.inforgram.cz