Rok 2002, č. 1, s. 7–19

Interaktivní vyhledávání informací

Jindřich Škrna

Výtah z diplomové práce [15] obhájené na ÚISK FF UK v roce 2001.

1 Úvod

Pokrok informačních technologií a neustávající informatizace společnosti vede k požadavku nezprostředkovaného vyhledávání informací koncovými uživateli. Přímá interakce koncového, informačně neškoleného uživatele však klade zvýšené nároky na vyhledávací systém (rozhraní). Koncový uživatel samostatně vyhledává relevantní informace většinou s obtížemi. Přesvědčivým důkazem tohoto tvrzení může být cenová politika databázových center typu Dialog, která se v poslední době výrazně orientují na koncové uživatele: poplatky za vlastní vyhledávání (doba připojení, doba pobytu v bázi) se minimalizují, zatímco rostou ceny za zobrazení relevantních záznamů.

Důvodem malé úspěšnosti uživatelských dotazů je např. neznalost syntaxe dotazů (booleovské a proximitní operátory), neznalost vyhledávání v polích; uživatel často neumí použít tezaurus a další typy pořádání a klasifikace. Podpora uživatele je míněna především jako podpora formulace dotazu a jednoduché použití vyhledávacího systému. K tomu účelu je zkoumána problematika ergonomického návrhu, přehlednosti, jednoduchosti a funkčnosti rozhraní vyhledávacího systému.

Zdokonalení komunikace mezi systémem a uživatelem tvoří podstatnou část prakticky orientovaných výzkumů vědců z oborů informační vědy, komunikace, počítačové vědy, ergonomie, kognitivní vědy či psychologie. Také specifický obor komunikace člověk - počítač (human-computer interaction, HCI) se při rozboru vyhledávacích systémů zaměřuje více na efektivitu komunikačních funkcí rozhraní, než na vlastní problematiku vyhledávání. V tomto duchu je pod běžně používaným termínem “interaktivní vyhledávání” rozuměn především dialogový způsob komunikace uživatele s vyhledávacím systémem. Ve světové literatuře se však objevuje ještě jiné pojetí interaktivního vyhledávání, které bude přiblíženo v dalším textu.

Oblast interaktivního vyhledávání zatím není příliš jednotná co do definice pojmů a používané terminologie, jednotlivých teorií a vlastně i předmětu zkoumání a jeho ohraničení. Proto se tato studie zaměří jen na nejpodstatnější společné body tohoto zajímavého přístupu k problematice vyhledávání.

2 Koncový uživatel a jeho okolí

Pro pochopení rozdílů v přístupu k procesu hledání informací a přínosu interaktivního vyhledávání musím nejprve seznámit čtenáře s některými poznatky o chování koncových uživatelů při vyhledávání informací a objasnit jejich chování v širších souvislostech.

Již samotný termín koncový uživatel je problematický. Koncový uživatel je pro mne laikem - a to ve čtyřech možných významech:

- z pohledu informatického: počítačově negramotný člověk, který neumí pracovat s počítačem (například se neorientuje na klávesnici či neumí používat myš);

- z pohledu informačního: informačně neškolený uživatel, který nezná metody vyhledávání, vyhledávací strategie, neorientuje se v problematice vyhledávání, neví, jak vyhledávací systém pracuje a jaké výsledky může od vyhledávání očekávat;

- z pohledu systémového: neškolený uživatel konkrétního vyhledávacího systému (nezná používané operátory, způsob určování polí pro vyhledávání apod.). Tato specifická rovina může být uvažována spolu s předchozím typem;

- z pohledu odborného: uživatel, který nezná dobře (a často vůbec) obor svého hledání. Laikem může být i vědec ve svém vlastním oboru (specializace) či dokonce i v oblasti vlastního výzkumu (vědec např. objeví dříve netušené souvislosti studovaného problému s neznámou hraniční disciplínou, kterou potřebuje pro další výzkum prostudovat).

Hlavní směr výzkumu a návrhu vyhledávacích systémů se soustředí na první tři roviny (zejména druhou a třetí) uživatelské nezkušenosti (uživatelská přívětivost, jednoduchost apod.). Čtvrtou rovinu uživatelské neodbornosti, která bude předmětem našeho zájmu, se snaží řešit právě teorie interaktivního vyhledávání. V praxi se pochopitelně různé úrovně neodbornosti uživatele vyskytují současně, což odráží i návrh interaktivních systémů. Pro účely jednoduššího pochopení se však v následujícím textu zaměřím pouze na problematiku uživatele-laika z pohledu odborného.

2.1 Řešení problému, hledání a vyhledávání

Vyhledávání informací představuje jen část informačních aktivit jedince. Spolu s T. D. Wilsonem [26] můžeme lidské informační aktivity a jejich výzkum rozdělit takto:

Informační chování je obecně lidské chování ve vztahu ke zdrojům a kanálům informací, zahrnující aktivní i pasivní hledání informací a použití informací. Proto zahrnuje přímou komunikaci s dalšími lidmi, stejně jako pasivní přijímání informací (např. lidé sledují televizní reklamy bez záměru se podle předkládaných informací chovat).

Chování při hledání informací je účelné hledání informací jako následek potřeby splnit určitý úkol. V průběhu hledání může jedinec vstupovat v interakci s manuálními informačními systémy (např. noviny či knihovna) nebo počítačovými systémy (vyhledávací systémy).

Chování při vyhledávání informací je mikroúroveň chování uživatele během interakce s informačními systémy všech druhů. Obsahuje všechny interakce se systémem, ať na úrovni interakce člověka s počítačem (např. použití myši a kliknutí na odkaz) nebo na intelektuální úrovni (např. osvojení booleovské vyhledávací strategie nebo určení kritérií pro rozhodování, která ze dvou knih sousedících na polici knihovny je nejužitečnější), což také zahrnuje mentální činnosti jako hodnocení relevance vyhledaných informací.

Hierarchii jednotlivých způsobů chování znázorňuje Wilsonův model [26] na obr. č. 1.

Informační chování - obrázek č. 1

Obr. č. 1

Tuto hierarchii vystihuje rozdílné používání pojmů vyhledávání a hledání. Pojem hledání informací (anglicky information seeking či searching) upozorňuje na kontext řešeného problému a kognitivní stav uživatele. Hledání více vyjadřuje cílevědomou aktivitu uživatele a podle G. Marchioniniho “je blíže k zodpovězení otázky či učení” [5]. Z obr. č. 1 je zřejmé, že vyhledávání informací (anglicky information retrieval) je pouze část procesu hledání: během hledání člověk informace také vyhledává. Proto někteří autoři pro interakce uživatele s vyhledávacím systémem používají výrazu hledání (např. A. Spinková - information seeking and retrieving [17]). Výraz hledání více odkazuje k účelu, pro který jsou informace hledány - k řešenému problému.

Metodika výzkumů chování uživatele při vyhledávání využívá celou řadu kvantitativních i kvalitativních technik. Kvantitativní techniky spočívají např. v zaznamenávání všech prováděných operací až na úroveň stisku klávesy či pohybu myší (tzv. prováděcí protokol), zkoumání počtu vyhledaných záznamů a hodnocení efektivity vyhledávání podle měřítek přesnosti a úplnosti, sledování uběhnutého času, počtu prohlédnutých a uložených dokumentů, vytváření statistiky využití jednotlivých funkcí systému apod. Mezi kvalitativní metody řadím vyplňování dotazníků před a po vyhledávací relaci, sledování a následnou analýzu interakce uživatele s informačním pracovníkem, požádání uživatele, aby vysvětloval všechny své kroky v systému - tzv. “myšlení nahlas”, zkoumání konzistence hodnocení relevance záznamů v průběhu hledání a po jeho ukončení s vytištěnými záznamy v ruce, pořizování videonahrávek uživatelů při interakci s vyhledávacím systémem a zprostředkovatelem (je-li přítomen) a jejich následnou analýzu a mnoho dalších.

2.2 Souvislost řešení problému a hledání informací

Lidé se v životě dostávají do situací, kdy potřebují zvládnout a řešit určitý problém (např. psaní diplomové práce, odborného článku nebo rozhodování o dalším směru výzkumu). Pokud k řešení problému nestačí současné znalosti, získávají informace buď myšlením, nebo z nějakého externího zdroje [21]. Využití vyhledávacího systému je tedy motivováno cílem vyřešit daný problém. Pokud však uživatelé nemají dostatečné znalosti o řešeném problému, často přesně nevědí, jaké informace pro ně mohou být užitečné [24].

Řešení problému probíhá ve více fázích. Např. podle Gaslikovové [1] tak můžeme určit tři základní fáze řešení problému podle typu hledaných informací a způsobu práce s nimi. Nejprve jsou znalosti o problému běžné a roztříštěné. Řešitel problému ještě neumí přesně formulovat problém a není schopen definovat, jaké specifické informace k řešení potřebuje. V tomto případě je cílem hledání získat přehled o dané oblasti a dále získat co nejvíce různých informací pro chápání problému. Ve druhé fázi má řešitel přesnější ponětí o problému, má představu o relevantních zdrojích informací a jejich obsahu. Řešitel provádí přímé a účelové hledání; umí definovat relevanci vyhledaných informací explicitními kritérii. Cílem hledání je návrh optimálního řešení problému. V konečné fázi řešitel hledá dodatečné informace, neboť prozkoumá přijatá rozhodnutí a snaží se potvrdit správnost svého řešení.

Například student má v době přípravy diplomové práce jen povrchní představu o dané problematice. Naopak při dopisování práce dovede problematiku strukturovat, určit jádro a hraniční oblasti apod. Na začátku hledání student vychází ze svých znalostí, které pravděpodobně nejsou uceleny. Relevantní jsou pro něj ty dokumenty, které mu umožňují spojit si existující znalosti, naučit se terminologii a utvořit si představu o šíři dané problematiky: například učebnice a skripta či odborné články. Vysoce specializované vědecké články pro něj informační hodnotu nemají. Naopak při psaní závěru práce je student odborníkem: obecné úvody do problematiky pro něj již nejsou významné; hledá specializované dokumenty.

2.3 Kontext a kognitivní stav uživatele

Teorie a modely interaktivního vyhledávání informací představují zcela nový pohled na problematiku vyhledávání, který vychází z kognitivního přístupu v informační vědě. Vznik tzv. “kognitivního rámce” můžeme datovat zhruba do poloviny 80. let 20. století, kdy dochází ke “kognitivnímu posunu” [7]. Uživatelé vyhledávacích systémů se nadále nezkoumají jako skupina, nýbrž jako jednotlivci, a to v širších souvislostech - spolu s ovlivňujícím okolím, neboli kontextem.

Kontextem jsou všechny osobnostní, kognitivní, situační a systémové faktory, které ovlivňují chování uživatele při hledání informací. Situačními faktory jsou např. podmínky okolí: dostupnost vyhledávacího systému a zdrojů, dostupné prostředky (peníze, čas ...) a náklady (finanční, časové, fyzické, kognitivní ...). Mezi systémové faktory zahrnujeme např. funkčnost systému, styly a možnosti interakce se systémem apod. Nejdůležitější složkou kontextu je však kognitivní stav uživatele. Ten v každém okamžiku odráží vnímání a myšlení jedince, což se projevuje v jeho chování. Na kognitivní stav jedince působí také únava, soustředěnost, připravenost vnímat informace, motivace, emoční složka osobnosti atd.

Všechny faktory jsou vzájemně složitě propojeny, což vede k tomu, že lidé používají, a také během vyhledávací epizody mění, rozličné strategie a způsoby chování. Problému přesného určení vlastností kontextu díky složitosti všech vstupujících faktorů si všímá např. D. Robins [12]: vše, s čím kdy přijdeme do styku, nás nějakým způsobem ovlivňuje; je obtížné předem tyto faktory omezit, jelikož každá situace má jedinečné vlastnosti, které v daném kontextu mohou být určující. V následujícím textu se budu soustředit především na kognitivní stav uživatele; od nedostatečně prozkoumaných systémových a situačních faktorů bude pro zjednodušení odhlédnuto.

Momentální kognitivní stav vyplývá především z kognitivní struktury jedince, která obsahuje veškeré získané znalosti a nabyté zkušenosti a dovednosti. Někdy bývá nazývána též znalostní strukturou či také poznatkovým/znalostním fondem jedince. Z hlediska našeho oboru jde například o znalost jazyků či odbornou specializaci, které výrazně ovlivňují relevanci vyhledaných dokumentů. Pracovní zařazení zase ovlivňuje typ požadovaných informací. V rámci jednoho oboru má rozdílné informační potřeby vědec v základním výzkumu, vývojový pracovník v soukromém sektoru, nebo manažer výzkumného projektu.

Klasickým příkladem toho, že kognitivní struktura opravdu působí na proces vyhledávání, je vztah relevance a pertinence. Vyhledaný relevantní dokument, který byl uživatelem prostudován, je sice stále relevantní, ale již není pro uživatele zajímavý a využitelný - již byl do poznatkového fondu zařazen.

Pokud se vrátím k mému pojetí laického uživatele, lze jednotlivým úrovním uživatelské neodbornosti přiřadit odpovídající části kognitivní struktury. Počítačově negramotný uživatel má například nedostatek motorických dovedností při použití myši. Informačně neškolený uživatel neumí vybrat relevantní informační zdroj (databázi), neumí vytvořit strukturovaný dotaz, neumí vyhledávat v polích, nezná specifika různých druhů dokumentů. I v případě, že uživatel má dostatečnou informační průpravu a zkušenosti s vyhledáváním obecně, může mít problémy s vyhledáváním v neznámém systému, který například místo booleovského operátoru NOT používá operátor AND NOT.

Z hlediska interaktivního vyhledávání je nejdůležitější částí kognitivní struktury soubor znalostí o řešeném problému a jeho okolí, který nazývám “pojetí problému”. Pojetí problému se vyvíjí spolu s řešením daného úkolu (viz příklad studenta píšícího diplomovou práci). Pojetí problému se projevuje schopností strukturace daného problému na centrální a hraniční oblasti, znalostí přístupů k problematice, vztahů mezi pojmy a používané terminologie, ale také třeba znalostí relevantních autorů, časopisů či databází. Proto má největší vliv na úspěšnost hledání. Vývoj porozumění problému ovlivňuje i hodnocení relevance vyhledaných záznamů, což vyplývá z výzkumu Vakkariho [2]: čím větší objem znalostí mají uživatelé o předmětu svého hledání, tím menší počet vyhledaných záznamů hodnotí jako zcela relevantní. Zároveň se zvyšuje podíl vysloveně nerelevantních záznamů.

2.3.1 Vliv kognitivního stavu uživatele na proces

vyhledávání informací

V první fázi řešení problému je pojetí problému neucelené. Právě tato neucelenost často vede k problémům spojeným s formulací dotazu: jak má člověk vyjádřit dotazem svůj informační problém, když sám přesně neví, co vlastně hledá? Může mít sice nějakou vágní představu o dané tematice, avšak neví, jaké pojmy se používají, a dále jaké dokumenty mu budou užitečné. To je příčinou obtíží koncových uživatelů najít v tradičních vyhledávacích systémech skutečně odpovídající (relevantní) a využitelné (pertinentní) informace. Stanovení rešeršního dotazu je přitom klíčovou částí, která nejvíce ovlivňuje úspěšnost vyhledávání. Informační profesionál zde hraje nezastupitelnou roli: během rozhovoru s koncovým uživatelem musí překonat případné sociální a komunikační bariéry, zjistit uživatelův informační problém a identifikovat informační potřebu. V anglické literatuře se pro tuto náročnou činnost objevuje výstižný termín “vylákání informací” (anglicky information elicitation).

Informační pracovník přitom během rozhovoru s uživatelem nedělá nic jiného, než že zjišťuje dodatečné informace o kognitivním stavu uživatele (účel hledání, míra podrobnosti, jazykový záběr a retrospektiva, forma, specializace a pracovní zařazení zadavatele rešerše apod.), které upřesňují informační problém. Nabízí se jednoduchý závěr: pokud vyhledávací systém dokáže, stejně jako profesionální rešeršér, rozpoznat kognitivní stav uživatele a získané informace aplikovat do procesu vyhledávání, bude poskytovat více relevantních záznamů. Proto tvoří studium interakce rešeršérů s uživateli podstatnou část výzkumu interaktivního vyhledávání.

2.3.2 Vliv procesu vyhledávání informací

na kognitivní stav uživatele

Bylo již řečeno, že kognitivní stav a celý kontext uživatele se v průběhu řešení problému mění (vyvíjí), což ovlivňuje chování uživatele při hledání a vyhledávání informací. Stejně tak i v průběhu vlastního vyhledávání podléhá kontext uživatele změnám.

V oblasti situačních faktorů dochází např. k vyčerpání dostupných prostředků (finance, čas - konec pracovní doby informačního pracoviště, ...), či působí faktory okolí (slunce svítící na matnici monitoru znesnadňuje práci se systémem, okolní teplota či hluk znemožňuje uživateli soustředit se plně na vyhledávání apod.). Systémové faktory se mohou projevit například poruchami počítače - častým zhroucením operačního systému či zobrazováním chybových hlášení neodladěného programu. Momentální kognitivní stav uživatele je ovlivňován např. i únavou, nebo pocity a motivací (pocit neúspěchu při vyhledávání vede k ukončení práce se systémem, nebo naopak povzbudí uživatele k prostudování nápovědy).

Kognitivní stav uživatele ovlivňuje zejména samotná práce s vyhledávacím systémem. Na uživatele působí veškeré přijímané informace (odezva systému, nápověda, chybová hlášení, tematický profil databází, struktura záznamů, struktura tezaurů, a také vlastní obsah záznamů apod.). Vnímání informací, ve snaze přijímaným informacím porozumět, nezbytně vede k jejich interpretaci a interpretace vede ke změnám v osobě, jež interpretaci provádí [6]. Zjednodušeně řečeno: během interpretace jsou přijímané informace konfrontovány se stávající znalostní strukturou a nové informace jsou transformovány v poznatky při jejich zařazování do znalostní struktury. Změna pojetí problému se odrazí např. ve formulaci nového, jinak zaměřeného dotazu, nebo v přehodnocení relevance již vyhledaných dokumentů.

Působení přijímaných informací na změnu chování uživatele během vyhledávání vysvětluje model využití informací “akvizice-poznání-aplikace”, který použil T. Saracevic jako základ svého modelu interaktivního vyhledávání [13]. Model je tvořen cyklem tří aktivit, které se vztahují k hledání informací: akvizice nových informací vzhledem k nějakému záměru, jejich poznávání (rozumové zpracování) a potenciální aplikace nově přijatých informací. Příklad: v seznamu vyhledaných relevantních záznamů se několikrát objeví jméno neznámého autora spolu s uznávanou kapacitou dané oblasti a stejnými výrazy obsahové analýzy. Podobným případem je citace neznámého autora v textu uznávaného odborníka. Koncový uživatel prostou úvahou dospěje k názoru, že dosud neznámý autor může být vysoce relevantní. V příštím dotazu bude nová informace (jméno autora) aplikována. Nově objevený autor například vychází z jiného teoretického základu a má odlišný názor na hledanou problematiku; letmé prohlédnutí plného textu může přivést uživatele k novým termínům, které se pokusí zadat v následujícím dotazu.

Vliv procesu vyhledávání informací na změnu kognitivní struktury uživatele, a speciálně na vývoj pojetí problému, vysvětlím na příkladu tzv. informačního průzkumu [3]. Informační průzkum je mapování neznámé oblasti hledání s použitím informací o struktuře informačního fondu a informací ze samotných záznamů. Tento typ chování se objevuje zejména v počáteční fázi vyhledávání. Rešeršér (informační profesionál či ne/zkušený uživatel) zkouší zadat vágní dotaz a prozkoumává výsledky dotazu. Tak získává znalosti o terminologii oboru, vztazích mezi pojmy (např. na základě struktury tezauru), souvisejících pojmech, dalších tématech, zajímavých citacích či jménech apod. To se odrazí i ve změně pojetí řešeného problému. Informační průzkum je však časově i kognitivně velmi náročný, vyžaduje zkušenosti s vyhledáváním a velké úsilí uživatele. To vede k požadavku vytvářet interaktivní systémy také jako nástroje informačního průzkumu pro koncové uživatele [4]. Příkladem takového systému může být velmi zajímavé experimentální rozhraní SenseMaker [28]. Cílem jeho autorů je pomoci uživateli při prozkoumávání heterogenních informačních zdrojů a vývoji pojetí problému.

Interakce s vyhledávacím systémem se podobně projeví i v dalších částech kognitivní struktury uživatele: rešeršér si mapuje daný informační systém (jeho vlastnosti, používané operátory, speciální funkce apod.) a zejména informační fond (tematický a časový záběr, excerpované časopisy, struktura záznamů, používané předmětové pořádání a systematické klasifikace jednotlivých bází atd.). Tak se mění znalosti práce s konkrétním systémem a informačním zdrojem, ale také obecné znalosti problematiky vyhledávání informací. Na úspěšnost vyhledávání má vliv třeba mentální model vyhledávacího systému, což je patrné z výzkumů adaptace uživatelů na nové vyhledávací prostředí [27] - např. přechod z přesného booleovského na vektorový model vyhledávání.

3 Pojetí vyhledávání

3.1 Tradiční pojetí vyhledávání

Vyhledávací systémy jsou, alespoň z měřitelných hledisek selekční účinnosti, stále efektivnější. Počítačoví odborníci zlepšují techniky automatického zpracování textů na vstupu informačního systému, techniky organizace databází či vlastního vyhledávání. Díky odborníkům na problematiku komunikace člověk - počítač (HCI) a zohledňování poznatků z psychologie a ergonomie jsou uživatelská rozhraní vyhledávacích systémů stále více uživatelsky přívětivější. Proto nás překvapí poměrně malá úspěšnost vyhledávání koncových uživatelů a jejich malá spokojenost s obdrženými výsledky. V některých výzkumech se dokonce píše o frustraci uživatelů z neúspěšného hledání. Problém neleží ani tak ve zlepšování vyhledávacích technologií, které jsou (ač se mnou čtenář nemusí souhlasit) relativně propracované. Přívětivá a přehledná grafická rozhraní vyhledávacích systémů sice přispívají ke zlepšení orientace uživatele v systému, nicméně samostatně problém neúspěšného hledání neřeší. Domnívám se, že největší změnou, kterou v blízké budoucnosti může celá oblast vyhledávacích systémů projít, je změna přístupu k uživateli na základě poznatků z kognitivních věd.

Pro tradiční systémově orientovaný přístup je charakteristické, že uživatel stojí vně systému a že středem systému je vyhledávací funkce, která porovnává dotazy s informačním fondem. Vývoj dalších částí systému je podřízen otázce co nejlepší podpory vyhledávací funkce. Tradiční přístup ilustruje model vyhledávacího systému C. J. Van Rijsbergena [29] na obr. č. 2.

Rijsbergenův model vyhledávacího systému 1979

Obr. č. 2

Tradiční pojetí chápe vyhledávací systém jako soubor prvků a procesů, který přijímá vstupy (dotazy a texty v informačním fondu), jež porovnává. Jako výstup poskytuje množiny záznamů, o kterých se předpokládá, že odpovídají zadanému dotazu. Jak již bylo řečeno, uživatel stojí vně systému. Jeho úlohu (a existenci) můžeme z jednotlivých modelů vyhledávacích systémů spíše vytušit. Nepřítomný uživatel pouze vytváří část systémových vstupů (dotazy) a modifikuje systémové výstupy (výsledky) do nových systémových vstupů. Modifikace výstupů se provádí do okamžiku, kdy je uživatel s výsledkem spokojen (iterace). Pokud se tvůrci vyhledávacího systému vůbec zabývají tím, jak uživatel dotaz vytváří, je tento proces jednoduše algoritmizován: informační potřeba à informační požadavek à informační dotaz.

Hlavní funkcí systému je tedy co nejlépe zpracovat své vstupy, přičemž část vstupů vytváří uživatel. Návrh moderních vyhledávacích systémů se soustředí zejména na problémy uživatele spojené s formulací dotazu (automatické rozpoznání fráze či automatické použití operátoru AND apod.). Přesto na uživateli zůstává nejtěžší úkol: je nucen explicitně vyjádřit svůj informační problém. Pokud nemá ucelené pojetí problému, nerozumí vztahům mezi pojmy a často nezná ani příslušnou terminologii. Nezkušený uživatel, který nezná základní principy vyhledávání informací, provádí informační průzkum jen obtížně. Většinou jen zkouší zadávat slova, která jej napadají, a v zobrazených výsledcích se snaží najít nějaké zajímavé záznamy, relevantní v daném kontextu.

Tradiční model vyhledávání poskytuje jen velmi omezené možnosti interakce. Proces hledání je řízen vyhledávacím systémem, který však má pasivní úlohu: pouze vykonává příkazy uživatele. S porozuměním odezvě systému si však uživatel musí poradit sám. Informace jsou chápány jako objektivní. Tomu odpovídá i definice relevance. Velmi zjednodušeně: pokud termíny v dokumentu odpovídají termínům v dotazu, dokument je relevantní. Proces hledání informací je zjednodušen na neúnosnou míru: je na něj nahlíženo jako na problém vyhledání co největšího počtu textů z databází na základě (více či méně upřesněného) dotazu. Jediná souvislost mezi jednotlivými kroky uživatele je iterace - zpětná vazba spočívající ve změně dotazu na základě předchozí odezvy systému.

Nedostatečnost tradičního přístupu k vyhledávání vtipně vyjádřil Nicholas J. Belkin: “Program, který - bez možnosti hodnocení, modifikace a zejména interakce s texty - zpracovává vstupy ve výstupy, by neměl být nazýván informačním systémem.” [6]

 

3.2 Interaktivní pojetí vyhledávání

Východiskem pro interaktivní vyhledávání je kritika nevyhovujícího tradičního přístupu, který se soustředí na zlepšování vyhledávací funkce a nebere v potaz kontext uživatele. S. Henninger a N. J. Belkin [30] se dokonce domnívají, že vyhledávací systém, který má slabé výsledky z pohledu měřitelné efektivity vyhledávání (přesnost a úplnost), ale poskytuje dobré možnosti prohlížení a iterativního dotazování (=interakce), může být mnohem úspěšnější v poskytování odpovědí na uživatelův problém.

Charakteristickým prvkem teoretických modelů i experimentálních systémů interaktivního vyhledávání je zcela odlišný přístupu k uživateli. Vznik tohoto teoretického směru souvisí s průnikem kognitivní a informační vědy v oblasti vyhledávání informací. Chování uživatele při vyhledávání je zkoumáno v souvislosti s kontextem uživatele.

Informace je brána ryze subjektivní - přídavek k dosavadním znalostem uživatele a jeho porozumění okolnímu světu. Vliv přijímaných informací na změnu kognitivního stavu se projeví v následujících krocích uživatele. Práce s vyhledávacím systémem není jen řada jednotlivých a na sobě nezávislých interakcí. Vědci se snaží porozumět vztahu mezi jednotlivými kroky uživatele a, pokud možno, následující kroky i předvídat.

V oblasti interaktivního vyhledávání jsou patrné dvě větve výzkumu. První větev je prakticky orientovaná a vychází ze současných možností informačních technologií. Vyhledávací systémy jsou reálně existující; často však jen v laboratorních podmínkách. Druhá větev se soustředí na hlubší teoretický výzkum a modelování procesu vyhledávání. Výsledkem snažení jsou převážně teorie a modely interaktivního vyhledávání.

3.2.1 Interaktivní vyhledávací systémy prvního typu

Jelikož je zjišťování kognitivního stavu uživatele problematické, vývoj systémů prvního typu se jím nezabývá. Návrháři vyhledávacích systémů se soustředí zejména na podporu formulace dotazu. Té je dosaženo implementováním technik interaktivní (re)formulace dotazu do tradičních vyhledávacích systémů.

Východiskem tvorby interaktivních vyhledávacích systémů je pozorování, že koncoví uživatelé nedokážou v tradičních systémech svůj informační problém či požadavek dobře formulovat, což vede k neuspokojivým výsledkům hledání. Příčinou neúspěchu je hlavně nedostatečné porozumění hledané problematice. Další příčinou je např. rozdílné používání terminologie různými autory či chyba indexátora - nevhodně zvolené termíny obsahové analýzy. Výběr vhodných termínů do dotazu proto představuje pro koncového uživatele klíčový, a často jen obtížně řešitelný problém.

V následujícím textu se zaměřím na techniku zpětné vazby relevance (anglicky relevance feedback). Zpětná vazba relevance (ZVR), na rozdíl od podobných technik reformulace dotazu, pracuje přímo s obsahem daného informačního fondu. ZVR má ověřenou účinnost: různé verze ZVR dosahují zlepšení výkonu vyhledávání v koeficientech přesnosti a úplnosti v rozmezí 24-46 % [8].

Princip interaktivní zpětné vazby relevance je jednoduchý. Dotaz zadaný uživatelem je brán pouze jako zkušební, jeho cílem je umožnit vstup do sbírky. Uživatel systému prohlíží seznam vyhledaných záznamů (často i s plnými texty dokumentů) a jednoduše označuje relevantní záznamy. Z relevantních záznamů pak systém automaticky vybere podstatné výrazy, jimiž upraví původní dotaz. Na základě upraveného dotazu systém vyhledá více relevantních záznamů. Celý cyklus se může opakovat. Některé systémy podobně pracují i s negativním hodnocením: podstatné termíny z označených nerelevantních záznamů jsou z dotazu odstraněny. Nejúčinnější verze této techniky přidává ještě další stupeň interakce uživatele se systémem. Před úpravou dotazu systém zobrazí vybrané výrazy a uživatel se sám rozhodne, které výrazy do upraveného dotazu zařadit a které vymazat [9].

Velmi zjednodušenou formu zpětné vazby relevance prezentují některé www rešeršní systémy. Jejich funkce “dotaz příkladem” (anglicky query-by-example, more like this, find similar či similar pages) fungují na stejném principu. Nový dotaz je však vytvořen pouze na základě jediného vybraného dokumentu.

Znění dotazu je výsledkem intuitivní a uživatelsky přívětivé interakce uživatele se systémem. Koncový uživatel nemusí znát vyhledávací metody a strategie, daný vyhledávací systém, uspořádání sbírky či strukturu záznamů. Aplikace interaktivních technik (re)formulace dotazu tak představuje poměrně jednoduchý způsob, jak nezkušeným uživatelům usnadnit vyhledávání.

Jak již bylo řečeno, interaktivní vyhledávací systémy prvního typu kognitivní stav uživatele nezjišťují. Přesto je jeho vliv do vyhledávání zahrnut: projevuje se právě označováním požadovaných záznamů. V daném okamžiku tak osoba pracující se systémem bezděky a intuitivně vyjadřuje svůj kognitivní stav, který ovlivňuje kritéria relevance. Novější teoretické přístupy k technice zpětné vazby relevance navíc umožňují sledovat vývoj pojetí hledaného problému tím, že např. sledují konzistenci přiřazování hodnot relevance jednotlivým dokumentům a to v kontextu celé vyhledávací epizody [10].

Největší výtkou interaktivním vyhledávacím systémům prvního typu je právě absence snahy o hlubší pochopení uživatele a jeho potřeb. Z hlediska kognitivního rámce nemají tyto systémy podstatný teoretický základ. Přesto jsou zajímavé. Ukazují, že je možné s kontextem uživatele efektivně pracovat, a dále odhalují možnosti aplikace jednotlivých interaktivních technik.

3.2.2 Interaktivní vyhledávací systémy druhého typu

Druhá větev výzkumu interaktivního vyhledávání informací je zatím převážně teoretické povahy. Otázka vývoje vyhledávacích systémů je zatím předčasná. Badatelé se soustředí na tvorbu modelů interaktivního vyhledávání a studium chování uživatele při hledání a vyhledávání informací. Někteří autoři se zaměřují na studium interakce uživatele a informačního profesionála během online vyhledávání. Provádí se např. analýza předmětu rozhovorů s cílem určit slovní obraty, které indikují tzv. “posun zájmu” - změnu předmětu hledání, zaměření se na konkrétní aspekt hledání apod. [11, 12].

Jednotlivé modely interaktivního vyhledávání jsou velmi rozdílné; přesto lze vypozorovat shodu v základních myšlenkách. V dalším textu se pokusím v několika tezích zobecnit přínosy jednotlivých modelů. Zájemce o jejich podrobnější studium odkazuji na svou diplomovou práci [15]. Z jednotlivých modelů je patrná snaha porozumět uživateli. K lepšímu pochopení je uživatel podrobně modelován a to spolu s ovlivňujícím kontextem. Vyhledávání informací zahrnuje komplexní interakce s různými typy informací. Tím dochází ke změně kognitivního stavu uživatele, která se projevuje změnami ve vyhledávacích strategiích, typech hledaných informací apod.

Mám na mysli zejména zpřesňování porozumění hledanému problému, které vede k přesnějšímu vyhledávání. Vakkariho studie [2] dokazuje, že při nesprávném pojetí problému, nepomohou uživateli zlepšit výsledek hledání ani automatické techniky úpravy dotazu (interaktivní vyhledávací systémy prvního typu). Podle Charlese Colea “skutečně interaktivní vyhledávací systém by neměl být založen na schopnosti systému pamatovat si a vyvozovat, nýbrž na změně pojetí informační potřeby uživatelem ... ... interaktivní vyhledávací systém musí být navržen tak, aby stimuloval tuto modifikaci, transformaci nebo změnu v kognitivním stavu uživatele” [23]. V následující kapitole představím vybrané teoretické modely interaktivního vyhledávání; zároveň se zmíním o některých praktických dopadech teorie interaktivního vyhledávání.

4 Modely interaktivního vyhledávání

4.1 Epizodický model interakcí při vyhledávání informací (Belkin 1995)

Prakticky orientovaný Epizodický model interakcí při vyhledávání informací N. J. Belkina [např. 6, 16] zdůrazňuje interaktivní povahu vyhledávání. Hledání informací je společným procesem, na kterém se podílí jak systém, tak uživatel. Proto je uživatel aktivní součástí modelu. Některé činnosti navíc nemůže provádět nikdo jiný než uživatel: např. hodnocení relevance nabízených záznamů, či změnu pojetí informačního problému [6].

Nejdůležitějším úkolem vyhledávacího systému je poskytnout uživateli co největší prostor pro interakci. Belkin se spolupracovníky [16] navrhl velmi zajímavou typologii způsobů interakce dle 4 dichotomních faset (metoda interakce, cíl interakce, režim vyhledávání a zdroj informací), jejichž kombinací vytvoříme 16 základních způsobů chování uživatele - vyhledávacích strategií. Přestože podle autorů není rozdělení vyčerpávající, zdá se být plně postačující pro charakteristiku běžných i méně běžných způsobů chování. Rozdělení vyhledávacích strategií není nutné k pochopení Belkinova modelu, proto se mu nebudu podrobněji věnovat.

Model interaktivního vyhledávání by se podle Belkina měl skládat ze tří hlavních prvků a pěti procesů. Prvky systému jsou uživatel systému, informační zdroj a prostředník, který umožňuje interakci uživatele s informačním zdrojem. Procesy rozděluje Belkin na: 1) reprezentaci - na straně uživatele jde o vyjádření jeho informačního problému ve formě dotazu, na straně systému je to vyjádření obsahu informačních objektů v záznamech sbírky (např. deskriptory); 2) porovnávání - vyhledávací techniky; 3) interakci mezi uživatelem a prostředníkem; 4) hodnocení - posuzování relevance; 5) úpravu - úprava vyjádření informačního problému dotazem.

Zahrnutí uživatele do systému se projevuje právě zařazením posledních tří procesů do modelu systému. Na obr. č. 3 vidíme, že interakce mezi uživatelem, informačním zdrojem a jednotlivými procesy systému je v modelu centrálním prvkem.

interakce mezi uživatelem, informačním zdrojem a jednotlivými procesy systému - obrázek č. 3

Obr. č. 3

Osoba hledající informace je v každém okamžiku v interakci s určitým typem informačního objektu. Typ interakce a informačního objektu závisí na kontextu hledajícího v daném okamžiku a dosavadním průběhu interakce. Interakci podporují prvky a procesy systému (např. porovnávání, vizualizace atd.). Vyhledávací epizoda se skládá jednak z řady rozličných interakcí strukturovaných podle určitého plánu vzhledem k celkovým cílům osoby, informačnímu problému, zkušenosti, specifickým cílům, a jednak ze všech předchozích interakcí. Jednotlivé typy interakce jsou nejlépe podporovány různými kombinacemi všech podpůrných procesů vyhledávacího systému.

Model znázorňuje dočasnou a cyklickou povahu interakce s vyhledávacím systémem. Belkinův model však, jak si správně všímá ROBINS [14], nebere v potaz kontext uživatele. Ten je sice v modelu znázorněn (cíle, úkoly, znalosti, problém, užití), avšak není jasné, jak při vyhledávání ovlivňuje chování uživatele.

4.2 Model interaktivní zpětné vazby a vyhledávacího procesu (Spinková 1997)

Amanda Spinková se dlouhodobě zabývá rozborem různých pojetí zpětné vazby. Spinková dokonce navrhla i nové paradigma zpětné vazby - paradigma informační vědy. Model interaktivní zpětné vazby a vyhledávacího procesu A. Spinkové [např. 17, 18] vychází z dosažených teoretických poznatků ve výzkumu zpětné vazby, které autorka kombinuje s empirickým průzkumem interaktivní techniky zpětné vazby relevance.

V interaktivním vyhledávání je zpětná vazba (ZV) faktorem vyhledávacího procesu a vztahuje se k širokému pojetí informace: informace je spojena s poznáváním a s kognitivními strukturami, ale také s intencionalitou, citovými stavy vzhledem k motivaci a také se sociálním, situačním a kulturním kontextem. Polarita zpětné vazby se vztahuje k hodnocení relevance vyhledaných záznamů.

Spinková kritizuje i některé interaktivní modely vyhledávání (jmenovitě Ingwersenův), z hlediska nedostatečné propracovanosti zpětné vazby. To vede autorku k vytvoření vlastního modelu, který je znázorněn na obr. č. 4.

interaktivní model vyhledávání Spinkové - obrázek č. 4

Obr. č. 4

Model znázorňuje cyklickou a iterativní povahu vyhledávání. Vyhledávání probíhá v cyklech (sekvencích řady interakcí). “Zpětnovazební cyklus je interakce, která se skládá (i) z dotazu, (ii) procesu, který vede k získání textu jako odezvy na dotaz, (iii) textu odezvy, (iv) interpretace vhodnosti textu vzhledem k proměnným (kognitivním, afektivním nebo situačním) a následné (v) činnosti, která vede k úpravě dotazu nebo vyhledávacího procesu” [31].

Empirickými výzkumy [např. 32 a 33] bylo zjištěno několik typů zpětné vazby (zpětnovazebních smyček), které můžeme rozdělit podle toho, zda se hodnotí obsah informačních objektů nebo strategie vyhledávání. Při hodnocení obsahu se objevuje ZV obsahové relevance (uživatel hodnotí vyhledané záznamy z hlediska jejich relevance) a ZV termové (termínové) relevance, při níž se nezkoumá relevance vyhledaných záznamů, nýbrž vhodnost možných termínů pro úpravu dotazu. Z hlediska vyhledávací strategie byla zjištěna ZV podle množství vyhledaných záznamů, zpětnovazební taktický přehled (hodnocení průběhu vyhledávací epizody např. zobrazením historie hledání) a zpětnovazební přehled termů (přehled použitých termínů v průběhu hledání).

Model Spinkové zahrnuje čas jako faktor vyhledávání a také cyklickou a iterativní povahu vyhledávání. Další výhodou tohoto modelu je, že jeho základem je empirický výzkum. Na druhou stranu je proces vyhledávání popsán pouze na povrchové úrovni: známe, jak se uživatel chová, ale nevíme proč. Model znázorňuje jen nespojitou řadu jednotlivých cyklů, smyček, kroků a hodnocení; kognitivní stav uživatele a jeho vliv na změny ve vyhledávacích strategiích není z modelu patrný.

4.3 Model interaktivního vyhledávání (Xieová 2000)

Autorka H. Xieová [19, 20] se ve svém modelu interaktivního vyhledávání (na obr. č. 5) soustředí na tzv. interaktivní záměry, které ovlivňují změnu vyhledávacích strategií. Model Xieové je nejnovějším modelem interaktivního vyhledávání a vychází také z modelů Belkina, Saracevice a Ingwersena. Vzhledem ke složitosti modelu se zaměřím jen na jeho nejpodstatnější rysy.

interaktivní model vyhledávání Xieové - obrázek č. 5

Obr. č. 5

Interaktivní záměry vycházejí z hierarchické struktury cílů uživatele a jsou dále ovlivňovány plánovanými a situačními vlivy. Dlouhodobým cílem je např. snaha mít vysokoškolský diplom. Hlavním cílem hledání je tedy získat dostatek podkladů pro napsání diplomové práce. Současným cílem uživatele je např. určitý výsledek vyhledávání - najít nějakou monografii o studované problematice. Interaktivní záměry jsou jednotlivé podcíle (například vyhledání záznamů, jejich ohodnocení, lokalizace jednotky a její získání), kterých uživatel musí dosáhnout, aby dokončil současný cíl. Plány ovlivňují chování při vyhledávání informací následujícími způsoby: mohou stanovit množinu podcílů, kterých musí být dosaženo pro zvládnutí aktuálního cíle; mohou určit odpovídající vyhledávací strategie, které vedou k vytyčeným cílům a pomáhají sledovat proces hledání a upravovat původní plán.

Vyhledávání informací je tvořeno souvislým posunem od jednoho interaktivního záměru, a odpovídající vyhledávací strategie, k dalšímu. Posuny interaktivních záměrů jsou buď naplánované, nebo jsou výsledkem aktuální situace (odrážejí výsledky jednotlivých interakcí s informacemi nebo s vyhledávacím systémem). Pokud je výsledná situace bezproblémová (splňuje daný interaktivní záměr), dochází k posunu interaktivních záměrů na základě připraveného plánu (naplánované posuny) a interakce probíhá rutinním způsobem. Vyřešení problémové situace vyžaduje přeskupení existujících znalostí, či získání nových znalostí a dovedností (zapojuje se kognitivní stav uživatele - pravá strana obrázku).

Autorka se dále podrobně věnuje analýze vzorů posunů interaktivních záměrů v průběhu vyhledávání. Znalost vzorců chování (posloupnost posunů interaktivních záměrů) by umožnila vytvořit vyhledávací systém, který by mohl uživateli v nesnázích pomoci při volbě vhodné následující vyhledávací strategie.

Model interaktivního vyhledávání má několik shodných rysů s modelem interaktivní zpětné vazby autorky Spinkové. Oba modely jsou založeny na analýze empirických dat a také se soustředí na mentální procesy uživatele. Model Xieové lze aplikovat do všech předchozích interaktivních modelů. Například v modelu Spinkové ukazuje, co vede ke změnám zdánlivě nespojených cyklů kroků a hodnocení. Stejně tak i v Belkinově modelu odhaluje motivaci pro změnu typu interakce v průběhu času. Xieová navíc odkrývá i další úroveň zkoumání interaktivního vyhledávání - mikrocíle uživatele. Tento model dle mého názoru nejlépe znázorňuje interaktivní povahu vyhledávání: každý krok vychází z aktuální situace, která je souhrnem uživatelova kontextu (cílů a plánů, znalostí a dovedností) a předcházejících interakcí. Na druhou stranu však z modelu není zřejmé, že při vyhledávání dochází také ke změně osobnostní infrastruktury - kognitivního stavu uživatele.

4.4 Globální model interakcí při vyhledávání (Ingwersen 1996)

Globální model interakcí při vyhledávání informací (nebo také model kognitivní komunikace - “cognitive communication model”) [21] plně odráží kognitivní přístup k vyhledávání informací. Jádrem kognitivního přístupu ve vyhledávání informací je teze, že zpracování informací lidmi zahrnuje nejen vnímání informací (dat), ale i transformaci informací do znalostní/kognitivní struktury jedince. Ingwersen užívá termín “vytváření informací”. Vyhledávání informací je podle Ingwersena vyhledáváním dat a jejich transformace lidským poznáváním.

Ingwersenův model je rozšířením předchozího teoretického modelu ZPROSTŘEDKOVATEL (MEDIATOR) z roku 1992 [7]. ZPROSTředkovatel byl koncipován jako automatizovaný prostředník, který modeluje profil uživatele na jedné straně a profil vyhledávacích systémů na straně druhé. Důraz na zprostředkující mechanismus je přítomen i v tomto modelu. Hlavní otázkou je, jak vyjádřit kognitivní struktury na straně systému (informační prostor) i uživatele (kognitivní prostor). Podle Ingwersena je to možné díky paralelnímu “vícenásobnému vyjádření” (tzv. polyreprezentace, anglicky polyrepresentation) kognitivních struktur.

Vyhledávání informací podle Ingwersena ovlivňují současně kognitivní struktury všech činitelů procesu vyhledávání - uživatele, zprostředkovatele, autorů textů, indexátorů a tvůrců vyhledávacího systému a jeho částí. Kognitivní struktury autorů textů se například projevují způsobem členění textu do podkapitol či odstavců, kognitivní struktura zprostředkovatele se projevuje např. nesprávným pochopením potřeb uživatele. Kognitivní struktury tvůrců vyhledávacího systému a jeho jednotlivých částí se projevují v jednotlivých částech programu, použitých algoritmech či grafickém ztvárnění. Při vyhledávání informací dochází k neustálé interakci kognitivních struktur. To znázorňuje Ingwersenův model na obr. č. 6.

interaktivní model vyhledávání Ingwersenův - obrázek č. 6

Obr. č. 6

Informační objekty představují kognitivní struktury jejich autorů, ale také indexátorů (jejich porozumění textu při obsahové analýze). Kognitivní struktury tvůrců vyhledávacího systému reprezentuje nastavení vyhledávacího systému, další roli hrají kognitivní struktury zprostředkovatele nebo rozhraní (kognitivní struktury tvůrců rozhraní). Kognitivní prostor (kognitivní struktury) uživatelů je třeba pojmout i v širším kontextu - sociálním/organizačním okolí uživatelů. Do sociálního okolí patří např. aktuálně přijímané společenské pojetí světa, obory výzkumu, stejně jako obory podnikání, pozice jedince v rámci organizační struktury firem či jeho profesní příslušnost apod. Kognitivní prostor se skládá z řady hierarchicky uspořádaných kognitivních struktur, mezi nimiž dochází k interakci. Mechanismus modelující uživatele by měl v každém okamžiku odvodit a reprezentovat současně několik funkčně rozdílných kontextů uživatele pro další zpracování systémem:

“co” - verze požadavku (dotazu), která zahrnuje vše, co je momentálně známo o neznámém (informační potřeba)

“proč” - stanovení problému a

“kde” - obor pracovního úkolu.

Také na informační prostor (levá část obrázku) musí být nahlíženo jako na polyreprezentativní a nekonzistentní strukturu. Průniky nekonzistentních struktur vznikají “kognitivní přesahy”. Aplikací rozdílných technik reprezentace a vyhledávání na informační prostor dochází k záměrné redundanci (různé vrstvy vyjádření). Jistá míra redundance je ve vyhledávání informací produktivní, neboť skýtá množství různých přístupových bodů ke stejným informačním objektům. Příkladem mohou být věcné selekční údaje: uživatel neznalý problematiky bude spíše využívat výrazů a struktury tezaurů a klasifikací, na rozdíl od experta, který přesně zná používané pojmy a vyhledává raději v názvech, abstraktech a plných textech dokumentů.

Ingwersen modeluje vyhledávání informací z globální perspektivy. Kognitivní pohled na vlastní vyhledávací systém (informační prostor) je v kontextu ostatních popsaných modelů ojedinělý. Centrálním prvkem systému je zprostředkující mechanismus. Je na zprostředkujícím mechanismu zjišťovat různé kognitivní struktury uživatele i informačního prostoru a odpovídající vrstvy vzájemně propojovat, neboť různým kognitivním úrovním uživatele odpovídají různé úrovně reprezentace textů. Přínos Ingwersenova modelu vidím právě v polyreprezentaci kognitivních stavů uživatele: paralelní vícenásobné zobrazení různých úrovní kognitivních struktur umožňuje jejich různou kombinaci během vyhledávání.

4.5 Vrstvený model interaktivního vyhledávacího systému (Saracevic 1997)

Vrstvený model [22] vychází z tradičního oddělení uživatele a systému, což umožňuje jednodušší práci s modelem. Saracevic rozkládá uživatele i vyhledávací systém do několika vrstev/úrovní.

Vyhledávání probíhá jako dialog mezi uživatelem a “počítačem” prostřednictvím rozhraní. Výraz “počítač” v uvozovkách zahrnuje veškeré aspekty práce s elektronickým informačním systémem. Během interakce s vyhledávacím systémem dochází ke změnám na hlubších kognitivních úrovních uživatele. Model je znázorněn na obr. č. 7.

Vrstvený model interaktivního vyhledávacího systému (Saracevic 1997) - obrázek č. 7

Obr. č. 7

Interakce je podle Saracevice “sekvence procesů, které se objevují na různých propojených úrovních” [22]. Saracevic navrhl tři úrovně. Vrstvy uživatele jsou: kognitivní - interakce uživatele s kognitivními strukturami; afektivní - interakce uživatele s jeho záměry, motivací, pocity, touhami, naléhavostí apod.; a situační - kontext: interakce uživatele s danou situací nebo okamžitým problémem. Vrstvy “počítače” jsou: technické zpracování - vlivy funkce hardwaru: kapacita, výkon atd.; zpracování - software, použité algoritmy, způsoby manipulace s daty apod.; a obsah - informační zdroje, různé způsoby reprezentace, metainformace a jejich charakteristiky (spolehlivost, informační hodnota …).

Interakce uživatele se systémem probíhá vždy na povrchové úrovni (rozhraní), na které můžeme také zkoumat chování uživatele i vyhledávacího systému. Pozorovatelná změna interakce na povrchové úrovni však vyplývá z hlubších úrovní uživatele i “počítače”. Uživatelé vedou dialog tím, že zadávají příkazy a přijímají odezvy systému. Tím se zapojují do řady procesů, které přesahují vlastní vyhledávání: porozumění vlastnostem částí vyhledávacího systému, prohlížení, navigace v rámci jednoho informačního zdroje a mezi zdroji, určení průběhu daného procesu, poskytování zpětné vazby, reagování na zpětnou vazbu hodnocení relevance apod. Na straně “počítače” je interakce ovlivňována vlastnostmi systému a jednotlivými procesy, které poskytují odezvy a mohou získávat informace o uživateli.

Podle D. Robinse [14] tkví potenciální nedostatek tohoto modelu v nedostatečném popisu dočasného efektu, neboť v modelu není zahrnut efekt času a iterací. Přínos modelu vidím v tom, že umožňuje jednoduché znázornění vrstev uživatele i systému. Dále je možné přidávat do modelu další úrovně (např. aplikovat přístup autorky Xieové). Tento model také umožňuje lepší pochopení globálního modelu Ingwersena (vícenásobné vyjádření různých kognitivních struktur na obou stranách a znázornění interakce mezi nimi).

4.6 Některé praktické aspekty zkoumání interaktivního vyhledávání

V předchozí části jsem popsal několik dosavadních teoretických modelů interaktivního vyhledávání. Aby obraz o celé oblasti interaktivního vyhledávání byl úplný, zmíním se ještě o praktické stránce výzkumu interaktivního vyhledávání.

Odraz teorie interaktivního vyhledávání můžeme pozorovat např. na případě konference TREC (http://trec.nist.gov). Text REtrieval Conference vznikla v roce 1992 s cílem podporovat výzkum v oblasti vyhledávání a automatického zpracování textů. Jednotlivé vyhledávací systémy jsou hodnoceny z hlediska jejich efektivity; k dispozici jsou testovací sbírky dokumentů, soubory dotazů i námětů hledání. Hodnocení systémů interaktivního vyhledávání informací bylo v rámci TREC prováděno již od prvního ročníku konference; tehdy byly interaktivní vyhledávací systémy zkoumány spolu s ostatními. Odlišnosti interaktivního náhledu na vyhledávání si však od třetího ročníku konference (1994) vynutily změnu ve způsobu hodnocení. Jednotlivé interaktivní systémy se nadále porovnávají pouze mezi sebou v rámci tzv. interaktivní koleje. Účastníci se každoročně dohodnou na přesných pravidlech a podmínkách zkoumání systémů. Od pátého ročníku konference (1997) je hledání pojato jako řešení úkolu (vytvoření pojetí problému, informační průzkum). Cílem vyhledávání není - oproti standardnímu testování efektivity - akumulovat co nejvíce relevantních záznamů. Uživatelé mají v časovém limitu (většinou 20 minut) najít co nejvíce možných způsobů řešení, jak vyplývají z vyhledaných dokumentů, které řeší různé aspekty stanoveného problému.

Teoretický výzkum interaktivního vyhledávání se soustředí většinou na možnosti zjišťování informací o kognitivním stavu uživatele a jejich použití při konstrukci dotazu. Objevují se však pokusy přímo kognitivní stav uživatelů ovlivňovat. Příkladem budiž Coleův “interaktivní systém pro pomoc s problémem” [34]. Je založen na výzkumu a analýze konkrétního úkolu studentů. Úkolem je zpracování zvláštního typu seminární práce, která má jasně danou strukturu. Tento typ seminární práce (anglicky tzv. compare-and-contrast essay) se používá při výuce historie. V textu mají studenti za úkol srovnat a postavit do protikladu dva pojmy. Účelem systému pro pomoc s problémem je adekvátní příprava kognitivního stavu uživatele na příjem informací. Ve zvláštním rozhraní má uživatel popsat obě srovnávané oblasti a určit hlediska - tzv. mosty, na nichž chce založit své srovnání. Tak vyhledávací systém nutí studenta myslet na text práce jako na celek, jehož středem je určitý argument nebo hypotéza. Během vyplňování je student kognitivně stimulován k sestavení již existujících znalostí a jejich integraci. Podle Colea je pak kognitivní stav studenta připraven k pochopení dalšího sdělení systému.

5 Závěr

Výzkum interaktivního vyhledávání probíhá zhruba od poloviny 80. let 20. století. Zatím však nelze hovořit o ustanovené oblasti, spíše o směru teoretického výzkumu či způsobu uvažování, který čerpá z řady vědních oborů - zejména z informační vědy, kognitivní vědy, komunikačních studií a počítačové vědy, a dále např. z psychologie, sociologie a ergonomie. Oblast interaktivního vyhledávání informací je - stejně jako sama informační věda - interdisciplinární povahy. Každý ze zúčastněných oborů představuje podstatný přínos, který by však bez spolupráce s dalšími obory byl neúplný.

Na základě studované literatury se domnívám, že oblast interaktivního vyhledávání vykazuje některé známky vzniku nového multidisciplinárního oboru. K tomuto závěru mne vede zejména: (1) rostoucí množství literatury rozebírající teoretická i praktická hlediska interaktivního vyhledávání; (2) společné východisko (kritika nevyhovujícího tradičního modelu vyhledávání). Publikující autoři (3) sdílejí podobný náhled na vyhledávání informací, a to i přes rozdílná pojetí a rozdílné teoretické základy. Navíc (4) dochází ke vzájemnému ovlivňování a prolínání jednotlivých teorií a modelů interaktivního vyhledávání. Závažnost tohoto směru může ilustrovat také skutečnost, že interaktivním vyhledáváním se zabývá řada špičkových autorů informační vědy (např. Tefko Saracevic, Nicholas J. Belkin, Peter Ingwersen a mnozí další). Zatím není shoda v základních otázkách; například, co vše do interaktivního vyhledávání spadá. Nejsou přesně definovány pojmy, ani není vytvořena jednotná terminologie. Dosud není vytvořena ani všeobecně uznávaná teorie interaktivního vyhledávání, která by podnítila další výzkum oblasti. Význam zkoumání vidím spíše v tom, že poskytuje zajímavý materiál k odborné diskusi a k dalšímu rozpracování.

Dosažené výsledky podle mne nepostačují k vytvoření fungujícího interaktivního vyhledávacího systému. Přesto očekávám, že vliv teorie interaktivního vyhledávání informací bude v blízké budoucnosti patrný i v návrzích reálně fungujících vyhledávacích systémů či rozhraní pro koncové uživatele. Interaktivní vyhledávání se vrací k původnímu významu slova, které je často nesprávně užíváno ve významu pouhé komunikace: interakce je vzájemné působení a ovlivňování.


Literatura:

1. GaslikovA, I. “Information Seeking in Context” and the development of information systems. Information Research [online]. 1999, vol. 5, no. 1 [cit. 2001-11-12]. Dostupné z: http://www.shef.ac.uk/~is/publications/infres/paper67.html.

2. Vakkari, P. A theory of the task-based information retrieval process : a summary and generalization of a longitudinal study. Journal of documentation, 2001, vol. 51, no. 1, s. 44-60.

3. Wilson, K. S. Evaluating information exploration interfaces : position paper [online]. 1999 [cit. 2001-11-12]. Dostupné z: http://www.fxpal.xerox.com/ConferencesWorkshops/CHI98IE/submissions/long/wilson/Default.htm

4. Brajnik, G. Information seeking as explorative learning. In Proceedings of Mira 99 : Evaluating Interactive Information Retrieval [online]. 1999 [cit. 2001-11-12]. Dostupný z: http://www.dimi.uniud.it/~giorgio/papers/mira99.ps.gz.

5. Marchionini, G. Information Seeking in Electronic Environments. Cambridge : Cambridge University Press, 1995. 236 s.

6. BELKIN, N. J. Interaction with texts : information retrieval as information-seeking behavior. In Knorz, G., Krause, J., Womser-Hacker, C. (ed.) Information retrieval ’93 : von der Modellierung zur Anwendung. Konstanz : Universitätsverlag, 1993, s. 55-66.

7. Ingwersen, P. Information Retrieval Interaction. London : Taylor Graham, 1992. x, 246 s.

8. Salton, G., Buckley, C. Improving retrieval performance by relevance feedback. Journal of the American Society for Information Scienc,. 1990, vol. 41, no. 4, s. 288-297.

9. Koenemann, J., BELKIN, N. A case for interaction : A study of interactive information retrieval behavior and effectiveness. In Bilger, R., Guest, S., Tauber, M. J. CHI 96 : Electronic Proceedings [online]. 1996 [cit. 2001-11-12]. Dostupné z: http://www.acm.org/sigchi/chi96/proceedings/papers/Koenemann/jk1_txt.htm.

10. Ruthven, I., Lalmas, M., van Rijsbergen C. J. Retrieval through explanation : an abductive inference approach to relevance feedback [online]. 1999 [cit. 2001-11-12]. Dostupné z : http://www.dcs.gla.ac.uk/ir/projects/explanation/aics.pdf.

11. Robins, D. Shifts of focus in information retrieval interaction. In schwartz, c., rovrig, M. (ed.) Proceedings of the American Society for Information Science. Vol. 34. Silver Spring (Maryland) : ASIS, 1997, s. 123-134.

12. Robins, D. Shifts of focus on various aspects of user information problems during interactive information retrieval. Journal of the American Society for Information Science, 2000, vol. 51, no. 10, s. 913-928.

13. SARACEVIC, T., KANTOR, P.B. Studying the Value of Library Information Services. Part I. Establishing a theoretical Framework. Journal of the American Society for Information Scienc, 1997, vol. 48, no. 6, s. 527-542.

14. Robins, D. Interactive information retrieval : context and basic notions. Informing science, 2000, vol. 3, no. 2, s. 57-61. Dostupné také z: http://inform.nu/Articles/Vol3/v3n2p57-62.pdf.

15. ŠKRNA, J. Možnosti a směry interaktivního vyhledávání informací [diplomová práce]. Praha : 2001. Vedoucí práce E. Bratková. 100 s.

16. BELKIN, N. J. aj. Cases, scripts and information seeking strategies : On the design of interactive information retrieval systems. Expert Systems with Applications, 1995, no. 9, s. 379-395.

17. SPINK, A. Information science : a third feedback framework. Journal of the American Society for Information Science, 1997, vol. 48, no. 8, s. 728-740.

18. SPINK, A., Losee, R. M. Feedback in Information Retrieval. In Williams, M. E. Annual Review of Information Systems and Technology. Vol. 31. Silver Spring (Maryland) : ASIS, 1996, s. 33-78.

19. Xie, H. Planned and situated aspects in interactive IR : patterns of user interactive intentions and information seeking strategies. In Proceedings of the ASIS annual meeting. Medfod : Learned information, 1997, s. 100-122.

20. XIE, H. Shifts of interactive intentions and information-seeking strategies in interactive information retrieval. Journal of the American Society for Information Science, 2000, vol. 51, no. 9, s. 841-857.

21. Ingwersen, P. Cognitive perspectives of information retrieval interaction : Elements of a cognitive IR theory. Journal of documentation, 1996, vol. 52, no. 1, s. 3-50.

22. SARACEVIC, T. The stratified model of information retrieval interaction : Extension and applications. In Schwartz, C., Rorvig, M. ASIS’97 : Proceedings of the American Society for Information Science. Vol. 34. Silver Spring (Maryland) : ASIS, 1997, s. 313-327.

23. COLE, C. Interaction with an enabling information retrieval system : modeling the users decoding and encoding operations. Journal of the American Society for Information Science, 2000, vol. 51, no. 5, s. 417-426.

24. BELKIN, N. J. Helping people find what they don’t know. Communications of the ACM, 2000, vol. 43, no. 8, s. 59-61.

25. Wilson, T. D. Models in information behaviour research. Journal of Documentation, 1999, vol. 55, no. 3, s. 249-270.

26. Wilson, T. D. Human information behavior. Informing science, 2000, vol. 3, no. 2, s. 49-55. Dostupný také z: http://inform.nu/Articles/Vol3/v3n2p49-56.pdf.

27. Cool, C. aj. Information seeking behavior in new searching environment. In ingwersen, P., Pors, N. O. (ed.) CoLIS 2. Proceedings of the Second International Conference on Conceptions of Library and Information Science : Integration in Perspective, October 13-16, 1996. Copenhagen : Royal School of Librarianship, 1996, s. 403-416. Dostupné též z : http://mariner.rutgers.edu/tipster3/colis.html.

28. Baldonado, M., Winograd, T. SenseMaker : an information-exploration interface supporting the contextual evolution of a user’s interests [online]. Stanford : Computer Science Department, Stanford University, 1996 [cit. 2001-11-12]. Technical Report SIDL-WP-1996-0048. Dostupné z: http://www-diglib.stanford.edu/diglib/WP/PUBLIC/DOC115.ps

29. van Rijsbergen, C. J. Information Retrieval. London : Butterworths, 1979.

30. Henninger, S., BELKIN, N. J. Interface issues and interaction strategies for information retrieval. In Bilger, R., Guest, S., Tauber, M. J. CHI 96 - Electronic Proceedings [online]. 1996 [cit. 2001-11-12]. Dostupné z: http://www.acm.org/sigchi/chi96/proceedings/tutorial/Henninger/njb_txt.htm.

31. SPINK, A., Losee, R. M. Feedback in Information Retrieval. In Williams, M. E. Annual Review of Information Systems and Technolog. Vol. 31. Silver Spring (Maryland) : ASIS, 1996, s. 33-78.

32. SPINK, A., SARACEVIC, T. Interaction in information retrieval : selection and effectiveness of search terms. Journal of the American Society for Information Science, 1997, vol. 48, no. 8, s. 741-761.

33. SPINK, A. Study of interactive feedback during mediated information retrieval. Journal of the American Society for Information Science, 1997, vol. 48, no. 5, s. 382-394.

COLE, C. Interaction with an enabling information retrieval system : modeling the users decoding and encoding operations. Journal of the American Society for Information Science, 2000, vol. 51, no. 5, s. 417-426.

 
 

zpět na obsah - obrázek