|obsah |index autorů |  | index názvů |  | index témat | | archiv |

 


 

Knihovna plus

2012, číslo 1


 

Tezaury v maďarské praxi

 

Erika Tóth / Univerzita Svatého Štefana, Filozofická fakulta / Jászberény, Maďarsko / Toth.Erika@abk.szie.hu

 

Všeobecně o tezaurech

Tezaury známe od středověku, slovo tezaurus (z latiny thesaurus) se tradičně používalo v různých jazycích pro označení univerzálních vědeckých spisů, encyklopedických děl a zvláště pak velkých slovníků; slovo ale původně označovalo i pokladnici. "V informační vědě a v jazykovědě známe výraz tezaurus jako slovní zásobu či slovník." (Ungváry, Orbán, 2001) Slovní zásoba v případě tezaurů zjednodušeně znamená lexikologie, sbírka slov. "V jazykovědě – zvláště v případě generativní mluvnice – tezaury rozumíme slovníky určené k lingvistickému využití, v nichž ke slovům přiřazujeme speciální sémantické, syntaktické a morfologické informace." (Ungváry, Orbán, 2001) Pro toto využití je charakteristické, že tezaury odrážejí rozmanitost, úplnost a komplexnost.

V knihovnických systémech je vždy významným prvkem aspekt identifikace dokumentů. Tezaury používáme v oblasti obsahové analýzy a vyhledávání dokumentů. Výrazy tezauru vyjadřují hierarchickou pojmovou konstrukci. Znamená to, že tezaury jsou kontrolované a měnitelné slovníky, glosáře, založené na přirozeném jazyce. V těchto slovnících se termíny nebo slova jeví jako pojmy. Tezaury vyjadřují nejvýznamnější sémantické souvislosti mezi pojmy. (MSZ 3418-87)

Pojmy jsou uváděny podle jejich vztahů nadřazenost, podřazenost nebo hypotaxe, hyperotaxe atd. Informační vyhledávací tezaury mají speciální úkol, a sice filtrovat přirozený jazyk a standardizovat používání slov. Tezaury sestávají z lexikálních jednotek, které slouží k vyjadřování pojmů, a mohou být vyjádřeny písmeny, čísly a jinými znaky podle předpisu standardu. (MSZ 3418-87) Lexikální jednotky tezauru reprezentují slova normalizovaného selekčního informačního jazyka.

Zvláště angličtí kritikové tezaurů uvádějí, že tezaurus není nic jiného, než "nesprávně pojmenovaná klasifikace, ukrytá za souznačné pojmy a za křížové odkazy specifických a generických pojmů". (Ungváry, Orbán, 2001) Tezaurus svým způsobem třídí pojmy daného oboru, v mezích abecedního pořádku.

Lexikální jednotky (deskriptory a nedeskriptory)

Lexikálními jednotkami tezauru jsou deskriptory a nedeskriptory, které slouží ke zpracování a vyhledávání informací. Lexikálními jednotkami určitého oboru mohou být:

Deskriptory jsou obsahově a formálně jedinečné lexikální jednotky tezauru, mezi kterými vždy vyznačujeme nejvýznamnější pojmové souvislosti. (Platthy)

Všeobecně jsou za deskriptory považovány všechny takové výrazy, které můžeme používat jako selekční jazyk pro popis obsahu dokumentů. (Ungváry, Orbán, 2001)

"Deskriptor je taková lexikální jednota tezauru, která je bezprostředně použitelná pro zpracování a vyhledávání informací." Ale "nedeskriptory jsou pro zpracování a vyhledávání informací vhodné jenom prostřednictvím deskriptorů." (MSZ 3418-87)

"Nedeskriptory jsou jednak takové výrazy, které mohou být synonymy nebo jsou pokládány za synonyma." (Ungváry, 2002) Na druhé straně, "nedeskriptory jsou takové speciální termíny, o nichž se dá předpokládat, že vzhledem k existenci univerzálního třídění, nemá smysl je používat pro jemné třídění". (Ungváry, 2002)

Slovní zásoba tezauru

Deskriptory a nedeskriptory mohou být jedno- nebo vícečlennými výrazy. Lexikální jednotky vždy užíváme ve standardizovaném gramatickém tvaru speciálního vědního oboru. V jednotlivých vědních oborech může být způsob vyjadřování velmi komplikovaný, složeniny a syntagma sestávají z více slov. Termíny vědních oborů můžeme užívat jako podstatné jméno nebo substantivní syntagma. V odůvodněných případech je povoleno používání vlastních jmen. Takto tvořené lexikální jednotky mohou být ve tvaru:

Množné číslo lze použít tehdy, neexistuje-li jednotné číslo, nebo mají odlišný význam. V maďarštině můžeme používat množné číslo v případě jazykové rodiny (např. Germánské jazyky) nebo při uvádění jmen jednotlivých národů (např. Němci). Zkratky používáme v odůvodněných případech, např. je-li zkratka rozšířenější než úplný tvar. V případě číslovek používáme arabské číslice.

Lexikálními jednotkami mohou být mnohovýznamové výrazy (homonymum, polysémie). Aktuální význam mnohovýznamových termínů uvádíme za lexikální jednotkou formou přívlastku (slova, složeniny, symboly) v závorkách.

K lexikálním jednotkám můžeme připojovat definice, vysvětlivky a poznámky, které popisují přesný význam. Vysvětlovacím textem může být i známý cizojazyčný ekvivalent.

Zásady pro selekci obsahově autentické lexikální jednotky:

Jednoznačnost znamená, že vybraná lexikální jednotka je srozumitelná sama o sobě, tj. i bez kontextu. Znamená i to, že vybrané slovo z textu dokumentu musíme nahradit jiným slovem (např. místo absolutistické vlády – absolutismus).

Výběr lexikální jednotky je vhodnější, když přesně vyjadřuje celek obsahu dokumentu.

Lexikální jednotky musí být stručné a mít přesnou formu, např. místo posesivní syntagma stavba bytů – bytová výstavba.

Lexikální jednotky splňují podmínku srozumitelnosti v širokých kruzích jazykového úzu (terminologie) vědního oboru (musíme pominout odborný slang).

Lexikální jednotku vybíráme v souladu s pojmovou kategorií, do níž patří pojednávaný předmět nebo problém – např. filmovací přístroj (kategorie stroje, nástroje), filmování (kategorie procesu).

Máme-li takové výrazy, které se vyskytují velmi často a jsou příliš obecné, musíme je specifikovat tak, že je kombinujeme s jinými výrazy a tvoříme složené termíny. Příliš specifické nebo málokdy se vyskytující výrazy generalizujeme. V tomto případě je doplníme synonymy nebo souznačnými výrazy. (Ungváry, Orbán 2001)

Existují takové obory, kde je nedostatek výrazů, v tomto případě se užívají perifráze. Lexikální jednotka nemůže být perifrází, proto musíme tvořit termíny.

Pojmy tezauru vybíráme z dostupných pramenů, přičemž vybíráme takové pojmy, které vyjadřují podstatné informace daného oboru. Kritériem pro výběr je vysoká frekvence výskytu pojmů v oboru. (Platthy)

Vícejazyčný tezaurus

V případě vícejazyčného tezauru se snažíme vytvořit samostatný způsob označení, který je nezávislý na jazyku, protože pojmové systémy a soustavy znaků používané v různých oborech mohou být rozdílné.

V případě vícejazyčného tezauru je hlavním problémem to, že výrazy jednoho jazyka nejsou ve všech případech shodné s jinými jazyky, pojmový okruh není shodný.

U překladů je důležité mít na paměti, že relace mezi stejnými pojmy se v různých jazycích liší, proto je problém řadit překlad na stejnou strukturu, jakou má výchozí tezaurus.

"Je-li struktura tezaurů shodná a vícejazyčnost znamená jenom překlad pojmů, pak v takovém případě v různých jazycích najdeme synonyma a tezaurus je symetrický." (Förhécz, Mészáros)

Jsou-li ve vícejazyčném tezauru relace odlišné nebo některé pojmy v některém z jazyků neexistují, je tezaurus nesouměrný.

Proti symetrickému tezauru stojí několik faktů:

Sémantika tezauru předpokládá, že každý výraz a pojem má autentické vyjádření. Význam však mají i synonyma, neboť pomáhají uživatelům při vyhledávání. Tedy i v překladu tezauru používáme autentické, oficiální vyjádření, které je akceptováno v daném případě, v daném jazyce, státu, ale to není vždy snadné. V každém jazyce musíme shromáždit synonyma, neboť různojazyčná synonyma nejsou srovnatelná. (Förhécz, Mészáros)

Tezaurus Széchényiho Národní knihovny v Maďarsku

V Maďarsku bylo vytvořeno již více než 50 tezaurů, z tohoto počtu se používá asi 20. (Ungváry, Orbán 2001) Prvním tezaurem, vytvořeným v roce 1970, byl Tezaurus všeobecných technických pojmů. Další následovaly, např. v letech 1972-73 tezaurus pojmů výpočetní techniky a informatiky. V roce 2000 byl dokončen tezaurus Národní knihovny (maďarsky OSZK-thesaurus), tzv. Veřejný tezaurus. Ten má více verzí, verze 3.0 byla dokončena koncem roku 2002. Veřejný tezaurus má důležité dodatky:

Veřejný tezaurus je pro uživatele a knihovníky dostupný v tištěném i elektronickém formátu. Na internetu je dostupný na adrese: http://mek.oszk.hu/00700/00769/html.

Maďarský tezaurus pro veřejné knihovny byl vytvořen podle mezinárodního standardu ISO 2788-86 a podle maďarského standardu MSZ 3418-87.

OSZK-thesaurus (Veřejný tezaurus) je všeobecný tezaurus, který obsahuje odborné výrazy a formální výrazy. Maďarský tezaurus je univerzální třídění založené na přirozeném jazyce, které obsahuje pojmy z oborů techniky, agronomie, ekonomie, přírodovědy, společenských věd.

"Tezaurus je vhodný pro klasifikaci monografií, periodik, plakátů, audiovizuálních dokumentů, hudebních skladeb, divadelních dokumentů, starých knih, rukopisů, firemních a jiných publikací." (Ungváry 2002)

"Do tezauru byly zahrnuty – bez nároku na úplnost – nejdůležitější výrazy, které používají veřejné knihovny pro univerzální třídění dokumentů a pro vyhledávání obsahů dokumentů." (Ungváry 2002)

Jednotlivé výrazy se projevují v různé formě, lexikální jednotky v tezauru mohou být následující:

Vlastní jména jsou:

 

 

Překlad Prókai Margit
Prokai.Margit@abk.szie.hu

 


 

Literatura

FÖRHÉCZ, András; MÉSZÁROS, Tamás. Többnyelvű tezaurusz építése és szolgáltatása webes környezetben. In: < http://nws.niif.hu/ncd2007/docs/ehu/107.pdf />.

MSZ 3418-87. Magyar nyelvű információkereső tezaurusz. Szerkezete, részei és formái. Budapest : Magyar Szabványügyi Hivatal.

PLATTHY, Zsuzsanna. A tezaurusz felépítése, használata. In: < http://hetenyi-eu.sulinet.hu/tezaurusz_html/tez/bevezeto.html />.

UNGVÁRY, Rudolf (összeáll.) 2000. OSZK Tezaurusz alkalmazási és karbantartási szabályzat. Budapest, In: < http://mek.oszk.hu/00000/00075/doc/alkalmaz.doc />.

UNGVÁRY, Rudolf (főszerk.) 2002. OSZK TEZAURUSZ/KÖZTAURUSZ : Az Országos Széchényi Könyvtár és a közművelődési könyvtárak átfogó tezaurusza : 3.0 változat. Budapest : MKE-OSZK, 2002. In: < http://mek.oszk.hu/00700/00769/html />.

UNGVÁRY, Rudolf. 2004. Tezaurusz és ontológia avagy a fogalmi ismertetőjegyek generikus öröklődésének formalizálása. In: Tudományos és Műszaki Tájékoztatás, 51. évf. 5. sz. In: < http://tmt.omikk.bme.hu/show_news.html?id=3615&issue_id=450 />.

UNGVÁRY, Rudolf; ORBÁN, Éva. 2001. Osztályozás és információkeresés : kommentált szöveggyűjtemény. Budapest, OSZK. 1. köt. Az osztályozás és elmélete. In: < http://mek.niif.hu/01600/01683/pdf/01683-1.pdf />. 2 köt. Az információkeresés és elmélete. In: < http://mek.niif.hu/01600/01683/pdf/01683-2.pdf />.

 

 



 

CITACE:
Tóth, Erika; Prókai, Margit. Tezaury v maďarské praxi. Knihovna plus [online]. 2012, č. 1 . Dostupný z WWW: <http://knihovna.nkp.cz/knihovnaplus121/jerabek.htm>. ISSN 1801-5948.

 

Valid HTML 4.01 Transitional

 


 

| nahoru | |obsah| | archiv | | domů |

 | index autorů | | index názvů | | index témat |