|obsah |index autorů |  | index názvů |  | index témat | | archiv |

 


 

Knihovna plus

2008, číslo 1-2


Archives and the digital library / William E.Landis, Robin L. Chandler, ed. -- Binghamton : Haworth, 2006. -- 270 s.

 

O digitálních knihovnách a elektronické archivaci digitálních dokumentů vyšla řada publikací zabývajících se tímto tématem z různých aspektů. Recenzovaný sborník se liší především tím, že přináší pohled na archivaci a tvorbu digitálních knihoven z praktického pohledu. Příspěvky sborníku původně vyšly v dvojčísle časopisu Journal of Archival Organization (1/2, 2006). Není náhodou, že téměř dvě třetiny z nich se věnují projektům a především zkušenostem s budováním a zpřístupňováním digitálních sbírek na půdě Kalifornské univerzity. Rozvoj informačních technologií a především internetu je po dobu poměrně krátké historie s touto univerzitou pevně spjat. Kalifornská univerzita byla mezi prvními institucemi připojenými na nově spuštěnou internetovou síť. Na půdě Berkeleyho univerzity byly budovány jedny z prvních digitálních knihoven. Také slavný arXive.org vybudovaný pod záštitou Národní laboratoře v Los Alamos je rovněž projektem, na němž se univerzita zprostředkovaně podílela, neboť tuto a další dvě významné americké národní laboratoře spravuje. Vědecká pracoviště Kalifornské univerzity ve spolupráci s knihovnami Kalifornské univerzity vyvinula rovněž mezinárodně využívané metadatové standardy pro archivaci digitálních objektů, jako je např. formát EAD sloužící k archivaci muzejních digitálních sbírek. V roce 1997 zde byla založena Kalifornská digitální knihovna (California Digital Library), která je de facto institucí virtuální. Na své půdě shromáždila odborníky na správu a rozvoj digitálních sbírek, aby tak vytvořila jednu z nejrozsáhlejších digitálních knihoven. Stovky knihoven nacházející se v deseti kampusech Kalifornské knihovny vytvořily jednotný systém vystupující navenek jako jedna entita charakteristická sdílenou katalogizací, sdílenou akvizicí se souborným katalogem Melvyl. Kalifornská digitální knihovna přesahuje svou aktivitou hranice univerzity. Do budování digitálních sbírek jsou zapojeny instituce po celé Kalifornii. Knihovny a vědecká pracoviště systému Kalifornské univerzity jsou průkopníky v digitalizaci a technikách ukládání a správy digitálních sbírek. Postupy a metody archivace zde vyvinuté jsou často přebírány dalšími americkými akademickými institucemi nejen ve Spojených státech, ale i ve světě. Zkušenosti předních odborníků s elektronickou archivací, obsažené ve sborníku, přinášejí informace z různých aspektů budování a především zpřístupňování digitálních fondů nashromážděných jak muzei a knihovnami Kalifornské univerzity, tak dalšími spolupracujícími paměťovými institucemi státu Kalifornie. Zkušenosti s elektronickou archivací přinášejí příspěvky nejen odborníků z dalších univerzitních knihoven z Illinois a New Yorku, ale také z Kongresové knihovny.

První část článků pod souborným názvem "Rozvoj nelicencovaného obsahu" přináší informace o inovativních projektech a programech zpřístupňujících obsah nepodléhající autorsko licenčním poplatkům. Zaměřuje se především na elektronické surogáty textových a grafických materiálů. V úvodním příspěvku se Adrian L. Turner, který působí v Kalifornské digitální knihovně jako datový konzultant a manažer projektů, věnuje praktickým zkušenostem s koordinací celostátního programu spolupráce paměťových institucí, především knihoven, na projektu California Local History Digital Ressource Project (ca 2000-2004). Realizace projektu zahrnuje budování sítě spolupracujících paměťových institucí (podílelo se na ní více než 40 knihoven a institucí), hledání finanční podpory u nadací a grantových agentur, vyhledávání a firem poskytujících služby v oblasti digitalizace.

Příspěvek Dayny Holz přináší praktické zkušenosti s budováním personálního digitálního archivu rukopisných dokumentů (korespondence) Marka Twaina – Mark Twain Papers (http://www.marktwainproject.org/). Charakteristickým pro tento projekt byla spolupráce odborníků z různých institucí Kalifornské univerzity, především Kalifornské digitální knihovny, a vydavatelství University California Press, které poskytlo metodiku zpracování dokumentů v metadatovém formátu TEI používaném tímto vydavatelstvím k archivaci a zpřístupňování vlastní produkce na webu (mimochodem významná část produkce University California Press je volně přístupná). Osobní korespondence Marka Twaina, uložená v archivu, obsahuje 11 000 dopisů, které Mark Twain napsal, a 17 000 dopisů, které obdržel. Kromě nich sbírka zahrnuje autorovy poznámky, fotografie a další dokumenty, které se nacházejí v jeho pozůstalosti.

Příspěvek Robina L. Chandlera a Genie Guerardové (poslední příspěvek první části sborníku) je věnovaný projektu California Cultures. Jedná se o projekt, který je součástí úsilí o digitální archivaci národního kulturního dědictví státu Kalifornie. Projekt California Cultures je významným příspěvkem k rozvoji Online Archive of California (OAC), jenž je jednou z prioritních sbírek tvořících Kalifornskou digitální knihovnu (dalšími jsou eScholarship - elektronický archiv prací odborníků a pedagogů Kalifornské univerzity, Calisphere - digitální archiv obrazových archivních dokumentů z dějin Kalifornie a souborný katalog Kalifornské univerzity Melvyl). Cílem projektu California Cultures je průzkum architektury digitálních knihoven a rámce podpory zprostředkování přístupu k digitálním archivům. V praxi tak navazuje na mnohaleté úsilí knihoven Kalifornské univerzity o vytvoření jednotného rozhraní pro přístup do rozsáhlého digitálního archivu kulturního dědictví OAC. Práce na zpřístupnění probíhaly v několika etapách, kdy bylo nutno na jedné straně vytvořit jednotné online rozhraní pro přístup k digitalizovaným materiálům v muzeích a archivech Kalifornské univerzity, na druhé straně podchytit veškeré sbírky nacházející se v těchto institucích. Pro tyto účely byl vytvořen a implementován tzv. finding aids, sloužící k vyhledání a lokalizaci archivovaných dokumentů. Hledání společného výměnného metadatového formátu, který by obsahoval metadatové údaje struktur EAD, TEI, Dublin Core a XML zároveň, a umožnil tak jejich plynulou výměnu mezi institucemi používajícími heterogenní formáty, vyústilo do vytvoření výměnného formátu METS. V případě projektu California Culture k vybudování nástroje pro editaci metadat (WebGenDB) ve formátu METS přes webové rozhraní a dále nástroje pro zachycení metadatové entity (GenDB) do báze Microsoft Access pro případnou další úpravu.

Druhá část sborníku je věnovaná otázce budování uživatelského rozhraní digitálních sbírek. Rosalie Lack se zde věnuje metodikám průzkumu a hodnocení uživatelské vstřícnosti webového rozhraní při vyhledávání v digitálních archivech Kalifornské digitální knihovny. Průzkum je zaměřený především na uživatelské zvyky a srovnává principy vyhledávání na webu (např. Google) a v knihovnách s cílem sladit metody vyhledávání s obecnými návyky internetových uživatelů. Merrilee Proffittová z RLG (Research Libraries Group) se v druhém příspěvku této části sborníku zabývá otázkou vybudování uživatelsky vstřícného a potřebám přizpůsobeného rozhraní souborného katalogu RLG (který byl od konce roku 2007 importován do databáze OCLC WorldCat). Poslední příspěvek od Maureen A. Burnsové se věnuje systému dodávání obrázkových dokumentů. Požadavky na dodávání digitálních obrázků rostou. V souvislosti s tím hovoří o způsobech zpřístupňování databází vizuálních dokumentů – jednak o komerčních, jimž jsou např. ARTstor a AMICO, jednak o bázích, které slouží především k dodávání obrázků školám pro výukové účely.

Poslední – třetí část sborníku, zachycuje stav digitální archivace speciálních dokumentů. V této oblasti vyvstává řada otázek a úkolů k řešení. Archivace webu je pro knihovny tématem víceméně vedlejším také proto, že s sebou nese celou řadu problémů spojených s identifikací archivovaných verzí stažených dokumentů, s množstvím efemérních informací, množstvím stažených stránek, s nefunkčností vnitřních odkazů na stránkách, a také s možností jejich plnotextového vyhledávání. Archivaci webu se věnuje světový Internetový archiv. Je faktem, že teprve zmizení velké části webového archivu BBC nastolilo nutnost uchovat významné informace na webu. Pro plnou archivaci webu musí archivované dokumenty splňovat archivační kritéria. Pro tyto účely se používá technika ukládání mirror site (obsahující adresáře a podadresáře). Stránka je v archivu pevně fixována, aby mohla být dále zpracována, resp. opatřena metadaty. V Evropě se řada knihoven zabývá archivací webu, ale, jak autoři příspěvku ukazují, používaná metoda indexace je nevyhovující už proto, že jsou indexovány jednotlivé stránky bez ohledu na to, že jsou součástí webového sídla. Při plnotextovém vyhledávání pak přináší odezva na dotaz obrovské množství irelevantních odkazů. Prohledání a uložení je jen jednou částí práce, druhou musí být restrukturalizace vnitřních odkazů uložených webových stránek. Projekt archivace webu MINERVA Kongresové knihovny se zaměřuje především na intelektuální obsah archivovaných dokumentů. To znamená, že nejde o pouhé zachycení webové stránky a její uložení; naopak knihovna používá deskriptivní metadata, která slouží k tematickému uspořádání archivovaných stránek. Projekt MINERVA v současné době archivuje stránky o prezidentských volbách v USA 2000 a 2002 a "The September 11th Web Archive" (obsahující na 2300 webových míst). Část metadat byla vygenerována přímo ze stránek, vyžadovala však kontrolu. Rovněž se ukázalo, že automatické generování metadat z webových stránek má celou řadu úskalí.

Druhý příspěvek sekce je věnován narůstající potřebě archivovat videozáznamy. V této oblasti elektronické archivace se dosud nepodařilo vyvinout funkční archivační formáty a standardy. Jerome McDonough z Univerzity v Illinois a Mona Jimenez z New Yorské univerzity přináší své zkušenosti s archivací videa – tématem nanejvýš aktuálním. Vždyť celá řada univerzit archivuje přednášky zachycené na videu. Náklady na přeformátování videozáznamů jsou poměrně vysoké, uskladnění analogových záznamů je neméně nákladné. RLG současně uvažuje o kompletní digitalizaci a nahrazení analogových záznamů digitálními. Archivace a otázka migrace formátů archivovaných dokumentů je nasnadě, také dosud nerozvinutý metadatový formát po videozáznamy je velkou překážkou v archivaci. Přesto je jasné, že je nejvyšší čas zahájit práci na standardizaci archivování videodokumentů a rozvoji metadatového formátu, který by obsahoval kromě technických, deskriptivních a strukturálních údajů též údaje o intelektuálním vlastnictví.

Otázkou výběru, spolehlivosti, stálosti a věrohodnosti získaných archivačních dokumentů a spolehlivosti systému (hardwaru a softwaru) spadající pod pojem "trusted digital repository" se zabývají Donald Janz a Michael Giarlo. Jako příklad, na němž demonstrují archivační postupy, uvádějí projekt archivace novin. Digitalizace starých výtisků je jen jednou částí práce. Výsledek textového převedení OCR v sobě vždy nese nepřesnosti a vyžaduje dodatečné textové úpravy. Výsledky plnotextového vyhledávání pak odpovídají kvalitě textového převodu. Joan Kaczmarek se snaží v příspěvku věnovaném komplexnosti digitálních zdrojů zodpovědět otázku, do jaké míry lze vymezit obsah a formu digitální knihovny, kdo odpovídá za její tvorbu a zpřístupňování a jaké postupy vedou k úspěchu digitálních knihoven, a to nejen na univerzitní půdě. Archivy jsou totiž výsledkem spolupráce mnoha institucí, které se na jejich tvorbě účastní různým dílem. Ukazuje, nakolik je důležité, aby byla tato činnost zastřešena celostátní informační politikou, která stanoví zásady a pravidla pro archivaci národního kulturního dědictví. V případě USA, je to National Digital Infrastructure for Information Preservation Program (NDIIPP) – Národní program infrastruktury pro uchovávání informací, který formuluje strategii a standardy pro uchovávání digitálních zdrojů. Rozhodující roli v tomto směru zaujímá Kongresová knihovna. Poslední příspěvek sborníku se věnuje rozvíjené open source softwarové aplikaci Archivists' Toolkit (na http://www.archiviststoolkit.org/), navržené na podporu tvorby a správy digitálních archivů, jenž je výsledkem dlouholetého spolupráce amerických vědeckých knihoven. Přináší přehled funkcí a architektury systému.

Ačkoli sborník nepokrývá svým rozsahem celé spektrum otázek týkajících se digitální archivace a digitálních knihoven v univerzitách USA (chybí zde např. archivace vědecké a odborné produkce univerzit, diplomových a disertačních prací, praktické otázky využití a zapojení digitálních zdrojů do výuky na vysokých a středních školách v rámci státem podporovaného programu K12), lze konstatovat, že přináší přehled stavu vývoje digitální archivace v polovině prvních deseti let 21. století v USA. Příspěvky jsou vybaveny bohatě odkazovaným materiálem, který poslouží k dalšímu studiu této problematiky. Knihu doplňuje předmětový rejstřík.

 

Daniel Kindl

 

  

CITACE:
Kindl, Daniel. Archives and the digital library / William E.Landis; Robin L. Chandler, ed.. Knihovna plus [online]. 2008, č. 1-2 . Dostupný z WWW: <http://knihovna.nkp.cz/knihovnaplus81/kindl.htm>. ISSN 1801-5948.

 

Valid HTML 4.01 Transitional

 


 

| nahoru | |obsah| | archiv | | domů |

 | index autorů | | index názvů | | index témat |