Publikované digitální dokumenty

Oblast Současný stav Finance 2005 v mil. Kč Koncepce rozvoje Finance 2006 Finance 2007 Finance 2008 Finance 2009 Finance 2010 Finance 2006-2010
v mil. Kč
Shrnutí V prostředí internetu průběžně narůstá obrovské množství publikovaných dokumentů, které se postupně mění nebo zcela mizí.Pokud nebudou průběžně archivovány, tato významná součást národního kulturního dědictví bude nenávratně ztracena. V ČR existuje v této oblasti od roku 2000 pilotní projekt WebArchiv podporovaný menšími ročními granty. Jeho výsledky jsou v mezinárodním kontextu vysoce ceněny. V současné době má k dispozici řešení na úrovni výzkumu a testování; využívá volně dostupných SW nástrojů (opensource), HW je zastaralý a na hranici použitelnosti.   Cílem je stabilní provozní zabezpečení a rozvoj v oblasti shromažďování, trvalého uchování a zpřístupnění digitálních dokumentů publikovaných na internetu a omezení nenávratných ztrát této části národního kulturního dědictví. Kromě adekvátního finančního a technického zabezpečení je nezbytnou podmínkou dosažení tohoto cíle změna legislativy a rozvoj kooperace centrálních, regionálních a specializovaných knihoven včetně propojení s vydavateli publikujícími na internetu.            
Získávání Získávání dokumentů z webu probíhá převážně automaticky na základě předem zadaných parametrů. Speciální SW zajišťuje stahování dat, jejich indexaci a ukládání do digitálního archivu. V současné době se používají a přizpůsobují volně dostupné SW nástroje s otevřeným zdrojovým kódem (Heritrix). Důležitou součástí je výběrová archivace jako intelektuální činnost s cílem registrace nejvýznamnější části publikací na internetu v České národní bibliografii (ČNB). Vzhledem k personálnímu poddimenzování nemohla tato činnost překročit rámec testování. 0,23 Pokračování automatického získávání dokumentů a plošné archivace doplněné o provozní zabezpečení výběru dokumentů pro registraci v ČNB a pro uchovávání v archivu (konzervační fond).  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Mzdové prostředky  0,67  0,70  0,74  0,78  0,82  3,71
Investice (servery)    1,00      1,00  2,00
Ostatní (služby IT - správa systému, programování, vývoj, lokalizace)  0,41  0,43  0,45  0,48  0,50  2,27
Archivace a ochrana Stažená data (webové zdroje a metadata) jsou ukládána v archivu v archivačních formátech, které by měly zajistit v rámci vývoje informačních technologií migraci dat a tím jejich trvalé zpřístupnění. Vedle serveru slouží pro archivaci diskové pole, jehož kapacita bude vyčerpána v roce 2006. V současné době jsou uloženy 2 TB dat, což představuje26 mil. archivovaných unikátních dokumentů. Počítá se s ročním přírůstkem 1-2 TB.  0,38 Počítá se s využitím centrálního datového úložiště pro Národní digitální knihovnu od roku 2006. Komunikaci s centrálním datovým úložištěm bude zajišťovat archivační server, bude využit speciální SW pro evidenci a správu souborů.  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Mzdové prostředky  0,59  0,62  0,65  0,69  0,73  3,28
Investice (servery, úložiště dat, SW)Poznámka: V nákladech na provoz centrálního datového úložiště je zde uvedena poměrná část pro WebArchiv.  1,00  1,00  2,00  1,00  1,08  6,08
Ostatní (služby IT - správa systému, programování, vývoj, lokalizace)  0,46  0,48  0,50  0,52  0,54  2,50
 
Zpřístupnění Pro zpřístupnění je v současné době využíván druhý server, který je stěží dostačující pro současné experimentální zpřístupnění malého souboru dat. Pro fulltextovou indexaci je využíván volně dostupný systém Nutch a nad ním postavená rozšíření Nutchwax a WERA.  0,25 Primární dokumenty budou uloženy na centrálním datovém úložišti, odkud budou zpřístupňovány. Specializovaný SW pro zpřístupnění bude nahrazen SW zakoupeným nebo vyvinutým pro digitalizované novodobé dokumenty.            
Mzdové prostředky  0,17  0,18  0,19  0,19  0,20  0,93
Investice (servery, SW pro zpřístupnění) Poznámka: V nákladech na pořízení HW a SW pro zpřístupnění je zde uvedena poměrná část pro WebArchiv.  1,00  2,00    1,00    4,00
Ostatní (služby IT - správa systému, programování, vývoj, lokalizace)  0,58  0,60  0,62  0,66  0,68  3,14
Standardy Ve všech oblastech jsou důsledně aplikovány mezinárodní standardy - pro popis online zdrojů formáty MARC21, Dublin Core, XML; pro identifikaci zdrojů jednoznačné mezinárodní identifikátory (ISSN, URN); pro archivaci formát ARC.  0,02 Existující mezinárodní standardy budou důsledně dodržovány, postupně budou implementovány standardy nově vznikající.            
S ohledem na novost a neustálenost administrativních a technických metadat a metadat pro ochranu v mezinárodním kontextu je aplikace metadat pro tyto oblasti nedostatečně propracovaná. Monitorování rozvoje administrativních a technických metadat a metadat pro ochranu v mezinárodním kontextu a po ustálení této oblasti jejich postupná aplikace.            
Popisy dokumentů vybraných pro Českou národní bibliografii a konzervační fond jsou experimentálně ukládány v systému ALEPH, který disponuje podporou protokolu Z39.50 na úrovni klient i server a podporou OAI-PMH pro režim repository i harvesting s profilem pro MARC 21 a kvalifikovaný DC. Bude využit nově zakoupený nebo vyvinutý SW pro digitalizované novodobé dokumenty, u něhož bude podpora existujících i nově vznikajících standardů (formátů i protokolů) samozřejmostí.            
Mzdové prostředky  0,08  0,08  0,08  0,09  0,09  0,42
Ostatní (programování, vývoj, lokalizace)  0,05  0,08  0,05  0,05  0,05  0,28
Legislativa Současná legislativa upravující povinnost vydavatelů odevzdávat určeným knihovnám povinný výtisk je pro publikované online zdroje nevyhovující. Současná verze Autorského zákona neumožňuje zpřístupňování dat z digitálního archivu (konzervační fond). Pro zpřístupnění je zásadním problémem současná verze Autorského zákona.  0,04 Ve spolupráci s právníky a vydavateli budou připraveny podklady pro úpravu současné legislativy týkající se povinného výtisku tak, aby byla použitelná také pro online dokumenty. Nová legislativa musí definovat povinnost vydavatelů odevzdávat online zdroje současným zákonným příjemcům povinného výtisku tradičních dokumentů. Je třeba definovat způsob předávání do depozitních knihoven a rovněž podmínky zpřístupnění webových zdrojů z digitálního archivu (konzervačního fondu).            
Mzdové prostředky  0,17  0,18  0,19  0,19  0,20  0,93
Ostatní (služby - legislativa)  0,12  0,12  0,12  0,05  0,05  0,46
CELKEM    0,92    5,30  7,47  5,59  5,70  5,94  30,00
Investice        2,00  4,00  2,00  2,00  2,08  12,08
Provozní náklady        3,30  3,47  3,59  3,70  3,86  17,92
Zdroj financování   Projekty   Koncepce Koncepce Koncepce Koncepce Koncepce Koncepce