| obsah |index autorů |  | index názvů |  | index témat | | archiv |

 


 

Knihovna

2005, ročník 16, číslo 2,  s.  29-43


 

Problematika dlouhodobé ochrany a zpřístupnění digitálních dokumentů na mezinárodním kongresu IFLA 2005

 

Výtah, překlad a komentář
Bohdana Stoklasová
Národní knihovna ČR
Bohdana.Stoklasova@nkp.cz

 

 

Aliance IFLA a ředitelů národních knihoven pro bibliografické standardy (IFLA/CDNL Alliance for Bibliographic Standards – ICABS) zvolila za hlavní téma své veřejné prezentace na mezinárodním kongresu IFLA 2005 v Oslo Zajištění přístupu k digitálním sbírkám, což dokazuje, že jde o téma, které „hýbe“ současným knihovnickým (a nejen knihovnickým) světem. Následující text přináší výtah a překlad podstatné části tří přednesených příspěvků popisujících současnou situaci ve Velké Británii, Německu a Austrálii, které zasazují domácí příspěvek Koncepce trvalého uchování knihovních sbírek tradičních a elektronických dokumentů v knihovnách ČR do širšího mezinárodního kontextu a zároveň obsahují řadu pro nás užitečných informací a podnětů.

Spolupráce v oblasti digitální archivace ve Velké Británii

Caroline Brazier

vedoucí doplňování a popisu sbírek, British Library, Velká Británie

Příspěvek shrnuje rozvoj kooperativních projektů ve Velké Británii, jejichž společným cílem je vybudování archivu digitálních publikací. Věnuje se nedávným změnám legislativy, které podpořily možnost vytvoření archivu digitálních publikací. Nová legislativa vychází z existující a prověřené legislativy pro budování národního archivu tištěných publikací. Popisuje pilotní kooperativní projekty zaměřené na rozšíření znalostí a zkušeností v oblasti digitálních archivů, mapuje výzvy a problémy, s nimiž se tyto projekty musí permanentně vyrovnávat. Podtrhuje nezbytnost kooperace pro zajištění životaschopnosti digitálních archivů. Zdůrazňuje skutečnost, že pouhá spolupráce knihoven zodpovědných za vybudování národního digitálního archivu nestačí – je nutné zapojit do spolupráce i sféru vydavatelskou.

 

Zákon o povinném výtisku a spolupráce depozitních knihoven

Ve Velké Británii existuje dlouhá tradice spolupráce šesti depozitních knihoven v oblasti vývoje a správy národního archivu tištěných publikací. Spolupráce navazuje na legislativu o povinném výtisku, která je relativně stabilní od roku 1911. Šest depozitních knihoven (British Library, National Library of Scotland, National Library of Wales, Bodleian Library v Oxfordu, Cambridge University Library a Trinity College v Dublinu) se dělí o katalogizaci povinného výtisku monografií (dělení probíhá formálně podle počátečního písmene názvu nakladatele) a společně vytvářejí Britskou národní bibliografii.

Prudký nárůst a rozvoj digitálního publikování odstartovaný pevnými nosiči typu CD na počátku devadesátých let vedl k obavám, že beze změny legislativy, která by umožnila knihovnám získávat, uchovávat a zpřístupňovat nově vznikající dokumenty obdobným způsobem jako dokumenty tištěné, přestane národní archiv odrážet skutečnou povahu publikovaných dokumentů. Stručný popis posunů v oblasti legislativní, technické i organizační, k nimž došlo v posledních deseti letech, odráží dlouhou a složitou cestu, která vede ve Velké Británii k naplnění cíle úplného digitálního archivu.

 

Proces rozšiřování zákona o povinném výtisku

Pravidla pro odevzdávání povinných výtisků tištěných dokumentů zakotvená v zákoně o povinném výtisku z roku 1911 platila 94 let. Během dvacátého století se objevily netištěné publikace a zvukové a obrazové dokumenty se staly veřejně dostupnými. Odevzdávání těchto dokumentů probíhalo dlouho na dobrovolné bázi a nebylo legislativně zakotveno. Situace se zkomplikovala po nástupu digitálních publikací – napřed šlo o dokumenty na pevných nosičích, postupně ve stále větší míře o elektronické on-line zdroje publikované na internetu. Jednání se zástupci vydavatelů na konci devadesátých let vedla k dohodě o dobrovolném odevzdávání elektronických zdrojů (Voluntary Code of Practice for Offline Publications) platné od roku 2000. Novelizovaný zákon o depozitních knihovnách v roce 2003 rozšířil povinnost odevzdávání na netištěné dokumenty s výjimkou zvukových nosičů a filmů, pro které zůstal zachován model dobrovolného odevzdávání. Zákon z roku 2003 byl pouze rámcový a nespecifikoval dostatečně mechanismus odevzdávání různých digitálních dokumentů. Ten bude upraven příslušnými vyhláškami. V současné době je jmenován vládní poradní výbor pro problematiku povinného výtisku, v němž budou zastoupeny depozitní knihovny i vydavatelé.

 

Spolupráce mezi knihovnami a vydavateli

V současné době probíhá odevzdávání i sklizeň elektronických zdrojů na dobrovolné bázi, případně (u webových stránek) na základě vyjádření souhlasu jejich provozovatele. Ze snahy ošetřit i oblast elektronických zdrojů zákonem se zrodil Společný výbor pro povinné odevzdávání dokumentů (Joint Committee on Legal Deposit), jehož členy jsou kromě depozitních knihoven i asociace vydavatelů příslušných dokumentů. Výbor tvoří osm zástupců těchto asociací a osm zástupců knihoven.

V rámci bilaterálních diskusí se snaží zástupci obou stran zformulovat kompromisní a oboustranně přijatelné návrhy, které budou předloženy vládnímu poradnímu výboru. Současnou prioritou jsou elektronické zdroje na pevných nosičích, které budou v rámci nové legislativy ošetřeny jako první. Dalším důležitým tématem společných diskusí a aktivit je návrh mechanismu dobrovolného odevzdávání elektronických časopisů. Citlivou oblastí vyžadující kompromisní řešení je přístup k elektronickým časopisům v knihovnách – vydavatelé se obávají menší poptávky a klesajících zisků.

Výbor se také věnuje otázkám teritoriálního vymezení a snaží se vytvořit použitelnou definici „britských publikací“ v prostředí globálního publikování. Jakmile budou dořešeny elektronické zdroje na pevných nosičích a elektronické časopisy, výbor se bude věnovat otázkám souvisejícím s odevzdáváním databází, datových souborů a sklizní britského webu.

 

Spolupráce depozitních knihoven

Spolupráce depozitních knihoven má pevné základy díky dlouhodobé společné tvorbě a správě národního archivu tištěných publikací. V souvislosti s nutností soustředit se na problematiku národního digitálního archivu založily depozitní knihovny několik pracovních skupin pro oblasti, které mají klíčový význam pro vytvoření a správu fungujícího národního digitálního archivu:

Národní digitální archiv musí umožnit příjem digitálních dokumentů i příslušných metadat, jejich uložení, ochranu a zajištění povoleného přístupu k obsahu archivu. V oblasti zpřístupnění archivu budou pravděpodobně platit podstatně přísnější podmínky než pro běžné komerční licenční zpřístupnění.

Pracovní skupiny pro jednotlivé oblasti řeší v současné době separátně i ve spolupráci tyto otázky:

První prioritou je technická infrastruktura a otázky spojené s vazbou mezi sdílenou částí a lokálními technickými potřebami a požadavky jednotlivých knihoven. Dalším důležitým okruhem pro současné diskuse je problematika metadat. Je nutné soustředit se nejen na deskriptivní metadata, ale též na metadata technická, administrativní, strukturální a dále metadata související s ochranou dokumentů a přístupovými právy. Metadatový rámec musí zajistit nejen vzájemné provázání zdrojů pro vyhledávání a správu sbírek ve všech šesti depozitních knihovnách, ale musí umožnit i vzájemnou spolupráci mezi centrální depozitní sbírkou digitálních dokumentů a šesti separátními, lokálními digitálními archivy, které budou jednotlivé instituce budovat paralelně.

Problematika rozvoje sbírek má rovněž zásadní význam pro definování požadavků na budoucí sdílenou infrastrukturu. Knihovny musí definovat své představy o povaze i míře rozvoje sbírek v souvislosti s jejich zařazením do národního archivu publikovaných digitálních dokumentů. Prudký nárůst a dynamická povaha digitálního publikování, zejména na webu, dovede knihovny k podstatně selektivnějšímu přístupu než u tištěných dokumentů.

Zcela pragmaticky je nutno vycházet ze skutečnosti, že míra selekce bude závislá na zdrojích pro zabezpečení celého životního cyklu vybraných dokumentů. Nestačí je jen přijmout a opatřit metadaty, ale je třeba zajistit i jejich dlouhodobou ochranu. Práce všech čtyř pracovních skupin se proto v mnoha aspektech navzájem velmi prolíná.

 

Dobrovolné odevzdávání elektronických publikací

Dohody o dobrovolném odevzdávání elektronických publikací fungují od roku 2000. Prozatím ještě nedošlo k plnému sdílení postupů v této oblasti, takže postupy šesti zúčastněných knihoven se mohu lišit. Příspěvek vychází z praxe British Library.

Dobrovolný Kodex pro odevzdávání netištěných dokumentů (The Voluntary Code of Practice for Deposit of Non-Print Material http://www.bl.uk/about/policies/codeprac.html), který se začal prakticky uplatňovat od roku 2000, měl pokrýt i elektronické zdroje na pevných nosičích. Praxe ale prokázala, že dobrovolně docházelo i k odevzdávání elektronických on-line zdrojů. Postupně narůstá procento dobrovolně odevzdávaných on-line zdrojů – v roce 2005 již tvoří 90% z celkového počtu odevzdaných elektronických zdrojů. Více než 70% obsahu seriálů bylo odevzdáno jako on-line zdroje. Bohužel nejde o velké akademické a odborné vydavatele. V posledních pěti letech bylo vynaloženo obrovské úsilí na zajištění bezpečného uložení, správy a ochrany těchto on-line zdrojů.

Dokumenty na pevných nosičích procházejí obdobnou linkou zpracování jako tištěné dokumenty. Na rozdíl od nich prošly on-line zdroje od roku 2000 několika fázemi. Původně přicházelo velké množství on-line zdrojů prostřednictvím elektronické pošty. Navzdory pochybnostem o odborné hodnotě některých zaslaných zdrojů bylo v počáteční pilotní fázi přijímáno vše s cílem získat co nejpřesnější představu o tom, jak zacházet s odevzdanými on-line zdroji. Ačkoli zpočátku bylo akceptováno vše, katalogizovány byly pouze odborně hodnotné zdroje.

Požadavky na kapacitu datového prostoru brzy překročily možnosti původního poštovního serveru a v určitém mezidobí byl obsah provizorně skladován na CD-ROM nosičích. British Library hledala komplexní řešení pro správu i uložení digitálních objektů. V rámci výběrového řízení na integrovaný knihovnický systém byl vybrán systém ALEPH od firmy ExLibris, která zároveň nabízí systém DigiTool pro správu digitálních dokumentů. Systém DigiTool byl zvolen pro vkládání, uložení a správu dobrovolně odevzdávaných elektronických zdrojů. Pracovníci British Library spolupracovali s vývojovým týmem firmy ExLibris na rozšíření DigiToolu o možnost poloautomatizovaného příjmu dokumentů, celkového zefektivnění procesu vkládání dokumentů a sdílení metadat využívaných pro správu tištěných dokumentů v systému ALEPH.

Současný postup bude podroben analýze v souvislosti s probíhajícím vývojem systému DOM (Digital Object Management) v British Library a celkovým rozvojem infrastruktury v šesti zúčastněných depozitních knihovnách. Všech šest knihoven se zároveň musí soustředit na strategii rozvoje sbírek. British Library již přehodnotila svoji vnitřní akviziční politiku pro on-line zdroje, protože řada materiálů nemá takovou trvalou hodnotu, aby bylo žádoucí je dlouhodobě uchovávat (např. on-line blahopřání k narozeninám, publikování pro vlastní zábavu, reklamy atd.), další materiály nevznikly ve Velké Británii nebo byly určeny pouze pro interní potřebu (např. interní firemní komunikace).

Prognóza prudkého nárůstu digitálního publikování v oblasti seriálů i monografií povede knihovny k nutnému výběru podle předem stanovených kriterií.

 

Pilotní projekt pro elektronické časopisy

Většina dokumentů získaných na základě dobrovolného odevzdávání byla seriálové povahy. Hlavní vydavatelé akademických a vědeckých časopisů odmítli dobrovolné odevzdávání z obavy o porušení přístupových a autorských práv. Společný výbor pro povinné odevzdávání dokumentů si proto vytknul právě tuto oblast jako hlavní prioritu pro jednání mezi knihovnami a vydavateli.

Pilotní projekt dobrovolného odevzdávání elektronických seriálů byl odstartován s dvaceti vydavateli akademických časopisů. Cílem je analýza otázek souvisejících s příjmem, uložením a ochranou různorodých formátů i obsahů produkovaných různými původci, dále pak vytvoření a šíření pravidel pro kontrolu odevzdávání elektronických dokumentů. Vydavatelé, kteří se zapojili do projektu individuálně či prostřednictvím svých asociací, zprostředkovávají kontakty s dalšími vydavateli a informují je o dosažených výsledcích. Po uzavření první etapy projektu bude uspořádán informativní workshop. Nejnaléhavějšími úkoly vyžadujícími rychlé řešení jsou bezesporu vhodné modely přijímání elektronických časopisů a přenos metadat a/nebo jejich extrakce z uloženého obsahu, aby byla zajištěna cenově efektivní správa archivu různými depozitními knihovnami.

 

Britské konsorcium pro archivaci webu [UK Web Archiving Consortium – UKWAC]

Hlavním limitujícím faktorem pro fungování současného dobrovolného odevzdávání elektronických on-line zdrojů je skutečnost, že ve chvíli, kdy vydavatel publikující na webu oznámí novou stránku nebo změnu stránky stávající, nemá British Library k dispozici infrastrukturu pro automatickou sklizeň. Manuálně může sklízet jednotlivé dokumenty nebo soubory, ale celé webové stránky s dynamickými vazbami musely být z praktických důvodů vyloučeny. Tuto mezeru by mělo zaplnit právě Britské konsorcium pro archivaci webu, jehož členy jsou: British Library, National Library of Scotland, National Library of Wales, The National Archives, Joint Information System Committee (pro podporu vyššího a dalšího vzdělávání v celé Velké Británii) a Wellcome Library. Pro roky 2006–2007 je cílem sklizeň 6 000 britských webových stránek, které přispějí k plnění cílů jednotlivých zúčastněných institucí a zároveň obohatí archiv britského webu.

Pro sklízení britského webu konsorcium v současnosti využívá australské programové vybavení [Poznámka: Článek byl napsán v dubnu 2005. Podle nejčerstvější ústní informace ředitele pro britské sbírky British Library na semináři o archivaci webu – Tallin 24.–25.11.2005 – a jeho zájmu o kontakt s českými specialisty pracujícími s programovým vybavením Heritrix, je zvažována i tato možnost, dalším perspektivním kandidátem je smart crawler vyvíjený pod hlavičku International Internet Preservation Consortium za hlavní účasti tří velkých knihoven: British Library, Bibliothèque nationale de France a Library of Congress. Pro příjem a správu webových zdrojů používá British Library systém DigiTool].

Informace o konsorciu jsou dostupné na jeho webové stránce http://www.webarchive.org.uk. Členové konsorcia se podělí o náklady spojené s vybudováním infrastruktury a zajištěním jejího provozu i technické podpory.

Britské webové stránky lze vymezit různě, konsorcium se ale soustředí na stránky vybrané podle těchto kriterií:

Toto vymezení se může, ale nemusí nakonec shodovat s právním vymezením teritoriality, které se stane základem pro budoucí legislativu o povinném odevzdávání elektronických online zdrojů. Jako pracovní vymezení pro pilotní projekt založený na dobrovolném odevzdávání těchto dokumentů je uvedené vymezení dostatečné a vyhovující.

Podle odhadů existují více než 4 milióny „britských“ stránek, takže kriteria výběru jsou cílena na uchování zdrojů a informací s dlouhodobě významným obsahem. Je třeba pozorně sledovat vyváženost zastoupení stránek zaměřených na

Kromě stránek vybraných pro pravidelné sklízení se konsorciální projekt soustředí také na vybrané stránky s krátkou životností, které mapují momenty zásadního významu (tsunami, volby, bombové útoky v Londýně atd.)

Práce v této oblasti jsou teprve v počátečním stadiu, je třeba sbírat a vyhodnocovat zkušenosti v oblasti technologické i provozní. Získání povolení může oproti původním odhadům trvat podstatně déle. Důležitou otázkou je, kam až povolení sahá (např. sklízení propojeného obsahu). Současná frekvence sklízení vytváří problém s pokrytím skrytého webu včetně databází, datových souborů a materiálu dynamického charakteru.

Tento model vysoce selektivního sklízení a archivace nemůže jednoduše přerůst do systému umožňujícího vytvoření úplného archivu britského webu. Britské konsorcium intenzivně spolupracuje s mezinárodním konsorciem známým pod názvem International Internet Preservation Consortium – IIPC http://netpreserve.org na vývoji inteligentního nástroje pro sklizeň webu (smart crawler), který by umožnil periodickou sklizeň celého britského webu. Pro podchycení již zmizelého obsahu (průměrná životnost webových stránek je 44 dní) uvažuje Velká Británie o nákupu příslušného britského webového prostoru od Internet Archive http://www.archive.org, jakmile to dovolí britská legislativa.

Britské konsorcium pro archivaci webu bude ve stávající podobě pracovat dva roky. Na základě vyhodnocení získaných zkušeností připraví realistické doporučení pro dlouhodobou archivaci webu. V mezičase vznikne archiv webových dokumentů, který se stane významnou součástí národního digitálního archivu. Také by se měla prokázat nutnost spolupráce více institucí v této oblasti.

Příspěvek shrnul řadu britských aktivit v oblasti digitální archivace. Soustředil se především na oblast povinného odevzdávání elektronických zdrojů do centrálních depozitních knihoven. Kromě těchto aktivit jsou samozřejmě budovány lokální repozitáře na univerzitách a v jiných výzkumných institucích, vzniká infrastruktura pro elektronické disertace, probíhá masivní digitalizace novin a zvukových nosičů, jejichž výsledky také obohatí britskou digitální knihovnu.

Britské knihovny musí nepochybně v oblasti zacházení s digitálními dokumenty ujít ještě dlouhou cestu. V současné době se hodlají soustředit a tři hlavní oblasti:

  1. Rozvoj nástrojů a infrastruktury pro příjem, ukládání, ochranu a zpřístupnění digitálních dokumentů odevzdaných v souladu s platnou legislativou.
  2. Efektivní tvorba, extrakce nebo generování metadat, která jsou nezbytným základem pro budoucí správu digitálního archivu.
  3. Ošetření autorských práv k digitálním dokumentům a z nich odvozených přístupových práv. K dosažení tohoto cíle je nezbytná těsná spolupráce s vydavateli a dalšími producenty digitálních dokumentů. Je nutné hledat taková řešení a cesty, které nebudou ohrožovat jejich zájmy, ale nabídnou jim příležitost pro vytvoření nového a životaschopného sortimentu služeb pro uživatele.

Poznámka: V závěru listopadu se konaly dvě konference (Digital Memory v Tallinu a Collection Mapping v Helsinkách), na nichž společně se mnou přednášeli také kolegové z British Library a ze skotských knihoven. Získala jsem tak jedinečnou možnost konfrontovat těsně po sobě poměrně odlišné názory na zde popsaný projekt. Zatímco British Library velmi usiluje o vytvoření silného systému (DOM) se značnou mírou centralizace a snahu národních knihoven Skotska a Walesu o autonomii pokládá spíše za komplikaci a rozmar, představitelé národních knihoven Skotska a Walesu pokládají centrální projekt za příliš složitý a nákladný a obávají se závislosti na centru, neboť intenzivně uvažují o zcela autonomním nebo distribuovaném řešení. Zatímco v oblasti organizační panují značné rozdíly, na nutnosti standardizace a posunu od přeceňování bibliografických metadat a podceňování metadat administrativních, technických a metadat pro dlouhodobou ochranu směrem k větší vyváženosti všech složek se zástupci všech uvedených institucí shodují.

Nestor a kopal – dvě národní iniciativy pro zajištění dlouhodobé dostupnosti digitálních dokumentů v Německu

Reinhard Altenhöner

Vedoucí oddělení informačních technologií, Die Deutsche Bibliothek, Německo

 

Nárůst elektronického publikování prostřednictvím sítí podstatně mění profil zejména těch knihoven, které zodpovídají za uchování národního kulturního dědictví. V Německu je situace v této oblasti velmi složitá, protože zde existuje celá řada různých knihoven zodpovídajících za získávání, zpracování a uchování publikací. Situaci je třeba přehodnotit s ohledem na organizační i technické změny v oblasti publikování. Je zřejmé, že pro zabezpečení výše uvedených činností je nezbytná kooperace.

Příspěvek ilustruje hlavní německé aktivity: kromě nezbytné přípravy legislativních změn vznikly v nedávné době dvě iniciativy: zatímco nestor je kooperativním projektem zaměřeným na dlouhodobou ochranu, kopal je zaměřen na vytvoření depozitního systému pro digitální dokumenty. V obou projektech je hlavním iniciátorem a koordinátorem Die Deutsche Bibliothek.

 

Obecný úvod

Elektronické publikování roste. Přesto stále není jasné, jak uchovat digitální publikace, umělecká díla, obrazové a zvukové dokumenty, datové soubory a hudební nahrávky způsobem, který umožní jejich stálou dostupnost v budoucnosti. Víme, že ať již bude v budoucnosti zvolena jakákoli strategie, bude založena na proudech bitů, jejichž integritu a autenticitu lze zachovat po řadu let. Je třeba dosáhnout odevzdávání dokumentů, k nimž bude v budoucnosti zaručen přístup na základě uchovaných proudů bitů. Probíhají diskuse o mnoha různých strategiích, které lze shrnout do dvou linií:

Kromě vlastního proudu bitů je nutná existence doprovodných metadat zachycujících zejména technické informace o uložených objektech, jejich původním technickém prostředí a historii jejich uchovávání. Vytvoření systému a infrastruktury pro dlouhodobou ochranu představuje složitý úkol a vyžaduje velké množství finančních i lidských zdrojů. Je nutná výměna zkušeností na národní i mezinárodní úrovni.

 

Role Die Deutsche Bibliothek

Die Deutsche Bibliothek je národní knihovnou a zároveň národním centrem bibliografických informací pro Německo. Zodpovídá za získávání a jmenné i věcné zpracování i dlouhodobé uchování publikací vydaných v Německu a/nebo v němčině po roce 1913. Platná legislativa se vztahuje na elektronické zdroje na pevných nosičích, nepokrývá ale elektronické on-line zdroje. V současné době se připravuje nová legislativa zahrnující i elektronické on-line zdroje.

Lze předpokládat, že mnoho knihoven s regionálním povinným výtiskem tak získá legislativní podporu pro své sbírky digitálních publikací.

Výsledkem přípravy na novou situaci je řada iniciativ Die Deutsche Bibliothek zaměřená na oblasti dlouhodobé ochrany německých digitálních publikací. Řada principů použitelných pro elektronické on-line zdroje byla definována v rámci úvodních jednání mezi vydavateli, knihovníky a vládními úředníky. Principy byly zformulovány do podoby dokumentu strategické povahy, který schválil v roce 1997 Publisher’s Committee of the Börsenverein des Deutschen Buchhandels:

V souladu s touto politikou testovala Die Deutsche Bibliothek v průběhu několika let ve spolupráci s vydavateli a ostatními producenty elektronických on-line zdrojů jejich získávání, zpracování, archivaci a dlouhodobou ochranu. V průběhu testování stanovila Pracovní skupina pro elektronickou depozitní knihovnu (Electronic Deposit Library Working Group) pravidla nezbytná k tomu, aby se Die Deutsche Bibliothek mohla stát depozitní knihovnou také pro elektronické on-line zdroje:

Při odevzdávání elektronických on-line zdrojů požaduje Die Deutsche Bibliothek také technická metadata potřebná pro dlouhodobé uchování dokumentů. Bylo třeba najít kompromisní řešení a nezatěžovat dobrovolně přispívající vydavatele přípravou složitých metadat nezbytných pro dlouhodobou ochranu. Die Deutsche Bibliothek se účastnila prací na projektu Nedlib. V rámci tohoto projektu byl přijat model OAIS (Reference Model for an Open Archival Information System) a byly navrženy postupy pro integraci knihovnických procesů.

Další důležité zkušenosti získala Die Deutsche Bibliothek v oblasti uchovávání a zpřístupnění elektronických zdrojů na pevných nosičích a při návrhu struktury persistentních identifikátorů pro Německo. Tyto identifikátory zajišťují stabilitu a jednoznačnou identifikaci digitálních objektů na síti.

 

Federativní uspořádání Německa

Federativní uspořádání Německa přináší významné prvky samosprávy na úrovni jednotlivých států zejména v oblasti vzdělávání, výzkumu a vývoje. Dalším významným prvkem je existence řady krajských knihoven s regionální depozitní funkcí. Je zřejmé, že úspěšná realizace dlouhodobého uchování dokumentů v prostředí federace je podmíněna spoluprací jednotlivých složek.

Platí to zejména pro organizaci, ale existuje řada politických i technických důvodů pro distribuci zodpovědnosti za uchovávání elektronických on-line zdrojů. Zúčastněné subjekty musí přijmout strategii pro dlouhodobé uchování elektronických on-line zdrojů a německá infrastruktura musí pokrýt oblast organizační i provozní.

 

Německé národní projekty

V Německu existují dva velké projekty zaměřené na problematiku dlouhodobého uchování dokumentů:

nestor (Network on Expertise in Long-Term Storage of Digital Resources)

se soustředí především na organizační aspekty a kooperaci. Projekt byl zahájen s cílem vytvořit platformu pro výměnu zkušeností i expertů mezi různými paměťovými institucemi.

Projekt financovaný Ministerstvem pro vzdělávání a výzkum byl zahájen v roce 2003 a bude dokončen v roce 2006. Pod vedením Die Deutsche Bibliothek se na projektu podílejí knihovny, vydavatelé, archivy, muzea a další instituce. V rámci projektu vzniklo několik pracovních skupin zaměřených na získání osvědčení kvality a hodnověrnosti repozitáře, archivaci multimédií, selekční kritéria a strategii dlouhodobé ochrany.

kopal (Kooperative Aufbau eines Langzeitarchivs digitaler Informationen)

je zaměřen na provoz systému pro dlouhodobou archivaci založeného na modelu OAIS. Projekt financovaný Ministerstvem pro vzdělávání a výzkum by měl vyústit v moderní technické řešení pro dlouhodobou archivaci a využitelnost digitálních dat. Řešení se opírá o systém DIAS (Digital Information and Archiving System) vyvinutý v rámci spolupráce IBM a Nizozemské národní knihovny v Haagu. V rámci projektu zahájeného v roce 2004 budou zúčastněné knihovny ukládat digitální dokumenty různého charakteru (od formátů PDF, TIF, TeX až po komplexní digitální objekty jako např. digitální video). Jedním z hlavních cílů projektů je transparentní integrace systému s existujícími knihovnickými systémy.

Při návrhu architektury celého systému byla oddělena základní funkcionalita archivního systému od okolních subsystémů zajišťujících homogenizaci a přenos digitálních objektů do systému. Oddělen byl také záměrně základní provoz a vývoj. Oddělení základní funkcionality (DIAS-Core) vyžaduje dobře definované rozhraní a otevřený přístup pro budoucí partnery. Nástroje pro tvorbu standardizovaných „vkládacích souborů“ a jejich import do systému budou založeny na open source (GPL) nástrojích. Stejná strategie byla zvolena pro modul prezentace digitálních objektů.

Důležitými stavebními kameny současné verze systému DIAS jsou:

Velká pozornost je věnována především definici datového modelu a architektuře systému.

Co je nutné od počátku vědět o zajištění přístupu k digitálním sbírkám

Pam Gatenby

náměstkyně ředitele pro správu sbírek, National Library of Australia, Austrálie

 

Před národními depozitními institucemi stojí v dnešní digitální době obrovská výzva. Dramatický nárůst informací na jedné straně a nedostatek zdrojů pro jejich zvládnutí na straně druhé mohou vyvolat dojem, že cesta kupředu je obtížná nebo zcela neschůdná. Přesto na světě existuje množství příkladů dokazujících, že začít (byť v malém měřítku) je mnohem lepší než čekat, až se vše samo vyřeší. Pro zvládnutí dlouhodobé ochrany digitálních zdrojů je nezbytná kromě existence strategie, potřebných znalostí a vhodných pracovních postupů také odpovídající infrastruktura. Není dobré zahajovat velké a komplexní programy zaměřené na archivaci digitálních dokumentů bez získání určitých zkušeností s menšími projekty. I menší projekty mohou zachránit podstatnou část kulturního dědictví, které by bez jejich existence bylo nenávratně ztraceno. Příspěvek se soustředí na základní procesy, které jsou nutnou součástí všech programů a projektů zaměřených na zajištění trvalého přístupu k digitálním zdrojům.

 

Úvod

Digitální zdroje, web a internet jsou dnes základní a neodmyslitelnou součástí světového informačního prostředí. Většina národních knihoven a dalších depozitních institucí se snaží zachránit alespoň malou část tohoto dědictví dostupného pouze dnes i pro budoucí generace. Tato nová role je rozšířením již existující odpovědnosti za uchování dalších složek kulturního dědictví.

 

Důležité obecné zásady

Existuje několik obecných zásad, které je třeba mít na paměti od počátku zahájení projektu:

 

Co je třeba zajistit pro správu digitálních dokumentů?

Základními předpoklady jsou existující a jasná politika instituce pro tuto oblast, potřebné znalosti a organizace pracovních postupů a v neposlední řadě vhodná technická infrastruktura. Hlavním předpokladem je ale ochota instituce zahajující program ochrany digitálních dokumentů přijmout odpovědnost za trvalé zpřístupnění uložených dokumentů.

Programy správy digitálních zdrojů jsou snáze udržitelné, pokud zapadají do celkového strategického kontextu instituce a navazují na již existující odpovědnost za shromažďování, ochranu a zpřístupňování jiných druhů dokumentů. Tento kontext může usnadnit rozhodování

o skladbě uchovávaných dokumentů, potřebné infrastruktuře, standardech i legislativním rámci. Úspěch celého programu závisí také na tom, jak je zakotven v organizační struktuře instituce a samozřejmě na jeho finanční i personální podpoře. Od počátku je třeba vědět, že půjde o akci finančně i personálně náročnou.

 

Hlavní činnosti

Pro správu digitálních dokumentů existuje řada provozních modelů. Pro zajištění dlouhodobé ochrany a zpřístupnění jsou však v každém případě nutné určité činnosti, které lze zařadit do několika skupin:

 

Výběr a získávání zdrojů

Než dojde ke získávání a shromažďování zdrojů, je nutné stanovit politiku výběru zdrojů a způsobu jejich získávání a shromažďování.

Výběr digitálních dokumentů ve smyslu ochrany kulturního dědictví je podobný výběru jiných dokumentů. Uplatňuje se řada stejných přístupu: výběr se odvíjí od strategie budování sbírek, jsou vybírány dokumenty trvalé hodnoty, posuzují se obsah a provenience dokumentů. Digitální dokumenty mají také svá specifika: ohromný rozsah, různorodá kvalita daná snadností jejich publikování, přechodná povaha, obtížnost stanovení jejich hranic a určení vlastnictví. I když výběr musí umožnit posouzení a vyhodnocení specifických konkrétních případů, musí vycházet z cílů organizace. Kriteria výběru by měla být veřejně publikována a měly by v nich být jasně pojmenovány faktory ovlivňující akviziční politiku i důvody pro zařazení nebo vyloučení určitých dokumentů.

Ochrana vybraných digitálních dokumentů znamená jejich vyjmutí z původního prostředí a uložení v digitálním archivu pro zajištění trvalého přístupu. Některé instituce vytvoří vlastní digitální archiv, jiné budou spolupracovat prostřednictvím distribuovaných nebo jiných modelů a využijí služeb jiné organizace. Archivní úložiště musí být bezpečné a spolehlivé a musí podporovat procesy nezbytné pro ochranu uložených dat před nežádoucím poškozením, změnami nebo ztrátou. Při kvalitní správě lze tyto podmínky splnit i s poměrně nenáročným vybavením. Nároky na složitost datového úložiště jsou dány mírou různorodosti a komplexnosti archivovaných zdrojů.

Získávání a shromažďování digitálních zdrojů zahrnuje několik klíčových oblastí:

Legislativní rámec pro shromažďování dokumentů

Před zahájením shromažďování dokumentů je třeba legislativně ošetřit oblast autorských práv a povinnost jejich odevzdávání. Depozitní instituce musí mít zejména právo kopírovat dokumenty pro účely ochrany a poskytovat přístup k archivovaným dokumentům.

Způsob získávání a shromažďování dokumentů

Existují dva základní způsoby získávání dokumentů – buď producenti dokumenty aktivně odevzdávají do depozitní instituce, nebo naopak depozitní instituce dokumenty shromažďuje od producentů sama (pro webové zdroje získávání dokumentů znamená kopírování originálních dokumentů). Po rozhodnutí o frekvenci získávání on-line zdrojů a získávání i režimu zpřístupnění zdrojů s omezeným přístupem je třeba mít k dispozici nástroje a pracovní postupy pro reálné shromažďování těchto dokumentů. International Internet Preservation Consortium (IIPC) vyvíjí nástroj pro sklizeň webu známý pod názvem Heritrix, který je v současnosti nejpropracovanějším nástrojem pro tuto oblast. IIPC rovněž poskytuje nástroje pro správu webových zdrojů založených na databázích a v současné době vyvíjí nástroj pro podporu malých institucí, které nedisponují dostatečnou technickou podporou a potřebují pracovat s webovými zdroji.

 

Organizace zdrojů

Po zařazení digitálních dokumentů do archivu je nezbytná jejich stálá kontrola a organizace, aby bylo možné je snadno lokalizovat, zpřístupňovat, využívat, spravovat a ochraňovat. Organizace zdrojů se skládá z řady dílčích činností:

Přidělování identifikátorů

Každý digitální soubor zařazený do repozitáře musí být opatřen jedinečným jménem, aby nemohlo dojít k jeho záměně s jinými soubory. Zdroj musí být dále vybaven persistentním identifikátorem, aby linky vedoucí k danému zdroji zůstaly funkční i v případě přestěhování zdroje.

Popis digitálních objektů s využitím standardních metadatových schémat

Metadata (strukturované informace o zdrojích) umožňují zdroje vyhledat a také umožňují jejích správu a ochranu. Je žádoucí využití standardních metadat, která lze sdílet v rámci různých služeb, zaručují konzistentní vyhledávání a vedou ke standardizaci i v oblasti trvalé ochrany. V současné době vzniká několik významných metadatových standardů. K nejvýznamnějším aktivitám patří projekt PREMIS (Preservation Metadata Implementation Strategie) zaměřený na trvalé uchování a dostupnost digitálních zdrojů, podporovaný OCLC, RLG a Library of Congress.

Pro vyhledání zdrojů je nezbytné přidělení alespoň základních metadat (název, autor, vydavatel, předmět atd.), která by měla být součástí nástrojů pro vyhledávání, kterými jsou například katalogy a databáze knihoven. Pro zajištění správy a ochrany digitálních zdrojů jsou nezbytná metadata popisující technické vlastnosti zdroje (typ zdroje, formát souborů, struktura dat, procesy využité pro tvorbu dokumentu a SW potřebný pro jeho využití). Je třeba zachytit také informace o změnách a různých operacích vztahujících se k digitálnímu zdroji během celého jeho životního cyklu; důležité jsou i informace o způsobu zpřístupnění zdroje.

Zajištění přístupu

Pro většinu depozitních institucí je cílem ochrana digitálních zdrojů a zajištění přístupu k nim v současnosti i budoucnosti. Předpokladem zpřístupnění uložených zdrojů jsou vhodné nástroje pro zajištění této funkce. Těmi jsou uživatelské rozhraní repozitáře pro vyhledávání, mechanismus zpřístupnění zdrojů pro prohlížení a také zabezpečení omezeného přístupu k některým zdrojům a všech dalších specifických podmínek vázaných na zpřístupnění zdrojů. Možnost zpřístupnění zdrojů se váže na legislativu spojenou s ochranou autorských a vlastnických práv a na dohodách s tvůrci a vydavateli. Efektivní přístup závisí na spolehlivých deskriptivních metadatech využitelných pro libovolnou formu zpřístupnění. Například archiv National Library of Australia známý pod názvem PANDORA (http://pandora.nla.gov.au) je přístupný prostřednictvím bibliografických záznamů obsažených v on-line katalogu knihovny, případně přes rejstříky dostupné na domovské stránce archivu. Ostatní archivy, jako například Internet Archive, umožňuje paralelní prohledávání a porovnávání různých webových zdrojů.

Systém pro správu digitálního archivu National Library of Australia se jmenuje PANDAS (PANDORA Digital Archiving System). Systém byl vyvinut na základě potřeb National Library of Australia, ale je využitelný i v jiných knihovnách.

 

Program dlouhodobé ochrany digitálních zdrojů

Program dlouhodobé ochrany digitálních zdrojů je tvořen řadou procesů zaměřených na dlouhodobou ochranu trvalé zpřístupnění digitálních zdrojů. Znamená to nejen uchování a správu proudů dat, ale i nástrojů pro jejich čtení a prezentaci, aby byla zajištěna možnosti jejich zprostředkování uživateli. Dobrá znalost charakteristiky zdrojů a rizik pro jejich trvalou dostupnost je nezbytná. Zařízení pro uložení digitálních zdrojů mohou být poškozena nebo zničena, HW i SW rychle zastarávají, takže časový horizont pro nutnost rozhodování o vhodné ochraně je podstatně kratší než u papírových dokumentů. Příslušné kroky je nutné udělat včas.

Nezbytnými podmínkami pro zajištění trvalé ochrany digitálních dokumentů jsou:

 

Vyjasnění cílů

Je třeba rozhodnout, co a jak dlouho má být uchováváno. Vymezení cílů a odpovědnosti instituce je třeba zahrnout do jasně formulované strategie. Je nutné posoudit funkcionalitu a autenticitu digitálních zdrojů potřebnou pro budoucí uživatele. S ní souvisí míra doprovodných informací, které je třeba podchytit pro budoucí zprostředkování archivovaných digitálních zdrojů uživatelům.

 

Znalost digitální sbírky

Je velmi důležité přesně identifikovat povahu dokumentů tvořících digitální sbírku a zaznamenat prostřednictvím standardních metadatových schémat technické informace o uložených dokumentech. Snadná dostupnost těchto údajů usnadní rozhodování o prioritách včetně zvládání rizik plynoucích ze zastarávání médií, SW či formátů, které se přestávají používat.

 

Ochrana dat

Stálá ochrana dat s využitím vhodných technických nástrojů je nezbytná pro zajištění jejich trvalé dostupnosti. Zahrnuje dostatečně dimenzovaná a spolehlivá datová úložiště, pravidelné zálohování a preventivní opatření proti ztrátě nebo poškození uložených dat.

 

Zvládání rizik

Je nutné předvídat a zvládat rizika spojená s trvalou ochranou a zpřístupněním digitálních dat. Je nutné permanentně vyhodnocovat rizikové faktory vyžadující určité akce. Permanentní monitoring dat, prevence a plánování přispívají k minimalizaci rizik.

 

Trvalá dostupnost

Nelehkým úkolem je zajištění trvalé dostupnosti uložených digitálních dat i v době, kdy formáty a nástroje používané v době vzniku příslušných digitálních dokumentů budou zastaralé a nepoužitelné. V této oblasti probíhá stálý vývoj, ale v zásadě jde o dvě základní cesty

– migrace dat a jejich zpřístupnění prostřednictvím nových formátů a nástrojů, nebo emulace původního prostředí existujícího v době vzniku dokumentů.

Trvalou dostupnost digitálních dokumentů podporuje:

 

Technická infrastruktura

Zajištění všech výše uvedených operací se neobejde bez robustní technické infrastruktury zajišťující získávání digitálních dat, jejich bezpečné uložení a dlouhodobou a snadnou dostupnost.

 

Co je třeba znát na začátku

Není vhodné zahajovat velké projekty v oblasti trvalé ochrany a zpřístupnění digitálních dokumentů bez získání určitých praktických zkušeností v rámci menších projektů. Nezávisle na velikosti projektu jsou nutné následující kroky:

 

Závěr:

I menší programy a projekty mohou zachránit před nenávratným zmizením podstatnou část národního kulturního dědictví a přinesou praktické zkušenosti potřebné pro úspěšné koncipování i praktické zajištění komplexních a dlouhodobých programů pro archivaci a zpřístupnění digitálních dokumentů. Je mnohem lepší začít s menšími a nedokonalými projekty v omezených podmínkách než čekat na dokonalá řešení a ideální podmínky a nedělat nic.

Poznámka na závěr: Zajímavý je odlišný přístup malých a velkých zemí k řešené problematice – velké země byly reprezentovány na konferencích v pobaltských a severských zemích, kterých jsem se v nedávné době účastnila, zástupci Velké Británie, USA a na konferenci IFLA také Německa, kdežto malé země zastupovali účastníci z pobaltských a severských zemí, Skotska a Česka. Zatímco ve velkých zemích vznikají velké projekty, množství pracovních skupin zaměřených na důkladné teoretické analýzy, malé země jsou podstatně pragmatičtější a jsou zde vidět hmatatelnější praktické výsledky. Je to dáno bezesporu tím, že velké země musí zvládnout obrovské množství dokumentů, jejich jazykový záběr (angličtina, němčina) sahá daleko za hranice země. Práce s takto velkými a složitě strukturovanými objemy dat vyžaduje náročnou teoretickou přípravu a velké země zároveň disponují dostatečnými personálními kapacitami na naplnění různých týmů, jejichž vzájemné propojení a informovanost ovšem nejsou vždy ideální. V malých zemích je objem dokumentů podstatně menší a tedy snáze uchopitelný. Malé země také nedisponují dostatkem lidí pro naplnění různých týmů. Titíž lidé jsou často členy mnoha týmů, což vede na jedné straně k dobré vzájemné koordinaci a rychlému posunu od teoretických studií k praktickým řešením, ale na druhé straně k přetíženosti a nedostatečné teoretické přípravě. Odlišné přístupy jsou logické a je dobře, že existují vedle sebe, protože se mohu navzájem obohatit. Malé země mohou využít důkladné teoretické přípravy velkých zemí a velké země naopak mohou využít praktické zkušenosti menších zemí a díky nim podstatně zkrátit nebo i nahradit některé své pilotní projekty. Austrálie jako země s velkou rozlohou, ale malým počtem obyvatel i zvládnutelným počtem publikovaných dokumentů stojí někde uprostřed a zatím dosahuje v oblasti trvalého uchování a zpřístupnění digitálních dokumentů nejlepších výsledků. Je to nepochybně dáno i tím, že se začala problematikou dlouhodobé ochrany a zpřístupnění digitálních dokumentů zabývat již v době, kdy se ostatní země domnívaly, že jde o problematiku budoucnosti, na jejíž řešení je dost času.

 

CITACE:

Stoklasová, Bohdana. Problematika dlouhodobé ochrany a zpřístupnění digitálních dokumentů na mezinárodním kongresu IFLA 2005. Knihovna plus [online]. 2005, roč. 16, č. 2, s. 29-43 . Dostupný z WWW: <http://knihovna.nkp.cz/knihovna52/ifla2005>. ISSN 1801-3252.

 

Valid HTML 4.01 Transitional

 


 

| nahoru | |obsah| | archiv | | domů |

 | index autorů | | index názvů | | index témat |