Báze WEB Národní knihovny ČR zpřístupněna
V polovině září 2003 byla veřejně zpřístupněna v rámci elektronického katalogu Národní knihovny ČR báze WEB. Ráda bych v tomto příspěvku reagovala na pár otázek, které jsem dosud v souvislosti s touto bází dostala a které svědčí o tom, že je třeba ujasnit, k čemu báze slouží a co od ní uživatel nemůže očekávat.
Především je třeba zdůraznit, že se jedná o bázi bibliografickou. Plní tudíž především funkce obdobné jiným bibliografickým bázím, které zatím u nás obsahují (až na vzácné výjimky) pouze záznamy popisující "klasické" dokumenty a (pokud se jedná o záznamy v katalogu) odkazující na konkrétní fyzické jednotky dostupné v knihovních fondech. Funkce báze NKC a všech ostatních dosavadních bází v katalogu NK ČR je tedy především zpřístupnění dokumentů uložených ve fondu příslušné knihovny a zároveň její přírůstky jsou zdrojem pro tvorbu soupisu registrující bibliografie (Česká národní bibliografie).
Vzhledem k tomu, že v našem případě se jedná o bázi obsahující výhradně záznamy elektronických online zdrojů přístupných na internetu, byla tato báze v rámci katalogu NK ČR vytvořena jako samostatná báze. Uživatel tedy na webové stránce pro přístup do tohoto katalogu v systému Aleph, nazvané Přehled bází NK ČR, najde vedle ostatních databází (NKC, AUT, ANL aj.) nově bázi WEB. Každá z bází se liší od ostatních bází charakterem popisovaných dokumentů, svým oborovým zaměřením či účelem, jemuž má sloužit. Báze WEB je specifická svým zaměřením na online zdroje. Je součástí komplexního projektu WebArchiv zahrnujícího problematiku získávání, archivace, registrace a trvalého zpřístupňování domácích elektronických zdrojů publikovaných online.
Pokud jde o rozsah báze WEB, tj. počet záznamů, nebude pravděpodobně nikdy tato báze srovnatelná např. s bází NKC, která dnes obsahuje již téměř 1,3 mil. záznamů vztahujících se k široké škále druhů dokumentů (knihy, seriály, mapy, hudebniny, zvukové záznamy, videozáznamy a elektronické zdroje - na hmotných nosičích, např. CD-ROM, DVD-ROM). Záznamy v bázi NKC apod. obsahují též lokační údaje umožňující uživateli objednat či rezervovat si online z fondu knihovny určitý exemplář dokumentu popsaného v záznamu. Tyto dokumenty, resp. exempláře jsou z knihovního fondu půjčovány v různých režimech - některé absenčně, jiné prezenčně v určených studovnách a exempláře z konzervačního fondu nejsou půjčovatelné, poněvadž se jedná o exempláře získané Národní knihovnou ČR jako depozitní knihovnou na základě zákonů o povinném výtisku a jejich hlavním posláním je být trvale uchovány jako kulturní dědictví.
Vedle toho báze WEB obsahuje záznamy popisující elektronické zdroje nehmotné a prostřednictvím zapsané URL adresy je umožněn přístup ze záznamu přímo do zdroje přístupného na internetu. Webové zdroje jsou charakteristické svojí pomíjivostí, tzn. kdykoliv je může kompetentní osoba z webu odstranit či v lepším případě změnit. Proto je naším cílem, aby ze záznamů v databázi byl současně umožňován přístup do digitálního archivu (WebArchiv). Tento přístup bude umožňován v souladu s platnou legislativou, podle níž není v současné době depozitní knihovna oprávněna své archivované internetové zdroje dále zpřístupňovat. Tato situace se prozatím řeší uzavíráním smluv s autory/vydavateli internetových zdrojů, v nichž smluvní strana uděluje souhlas se zpřístupněním svých původních zdrojů archivovaných v digitálním archivu NK ČR. Tento souhlas může být udělen pouze s lokálním zpřístupněním umožňujícím pouze čtení zdroje či s "veřejným" zpřístupněním umožňujícím přístup bez omezení, odkudkoliv a s možností kopírování. Tato činnost je ovšem velmi složitá z hlediska právního řešení, časově náročná, vyžadující intelektuální práci. Zatímco proces "získávání" zdrojů je již možno řešit automatickým procesem, kdy sběr zdrojů z webu lze provádět na základě zadání programu, zpřístupnit zdroje z archivu lze pouze výjimečně. Pro spolupráci s vydavateli, tj. uzavření smlouvy o zpřístupnění zdrojů, jsou vybírány webové zdroje podle stanovených selekčních kritérií.
Báze WEB má tedy následující funkce, víceméně obdobné jako funkce báze NKC v elektronickém katalogu NK ČR, i když kvůli prozatím nevyřešené legislativě v obráceném pořadí důležitosti:
1. Ukládání bibliografických záznamů ve standardním formátu, popisujících domácí webové zdroje. Jedná se o záznamy elektronických zdrojů vybraných na základě selekčních kritérií obdobných kritériím výběru tradičních druhů dokumentů pro konzervační fond (v tomto případě poskytovaných do fondu depozitní knihovny na základě povinností vydavatelů vyplývajících ze zákonů o povinném výtisku). Výběr zdrojů je zaměřen na jejich trvalé uchování jako kulturního dědictví a současně pro jejich registraci v České národní bibliografii. V rámci silně limitovaných pracovních kapacit na tuto činnost je proto snahou řešitelů zařadit do souboru vybraných zdrojů pokud možno ty, které si z hlediska svého obsahu a/nebo formy zařazení mezi "kulturní dědictví národa" skutečně zaslouží.
2. Zpřístupňování zdrojů popsaných v databázi bibliografickým záznamem. Nejedná se zde o zpřístupňování dokumentů, které knihovna vlastní, nýbrž - prozatím - o zpřístupňování vybraných dokumentů, které jsou (nebo byly, ale již nejsou) zveřejněny v síti internet a jsou významné pro trvalé uchování a zpřístupnění v blízké či pozdější budoucnosti.
V žádném případě tedy není účelem této báze, aby sloužila pro vyhledávání zdrojů na internetu. K tomuto účelu již slouží různé více či méně dokonalé vyhledávací stroje. A pokud jde o vyhledávání v digitálním archivu českých webových zdrojů, věříme, že se podaří dospět k tomu, co je smyslem projektu WebArchiv a řady projektů v jiných zemích: zajistit jednak solidní nástroj pro vyhledávání zdrojů uložených v archivu - tedy řešení náročných problémů v oblasti informačních technologií, ale též zajistit zpřístupňování těchto archivovaných zdrojů z hlediska legislativního. Jsou země, i když jich není mnoho, kde oba problémy jsou již alespoň do jisté míry vyřešeny. Možná budeme časem i my (myslím české uživatele, nikoliv nás řešitele) těmi, kdo bude mít možnost zkoumat vedle tištěných, příp. dalších "hmotných" dokumentů představujících literární dědictví také ty "virtuální", které jsou v současné době odkázány k trvalé ztrátě.
A ještě pár slov na závěr: Báze WEB je v současné době v testovací fázi. Možnosti přístupu k záznamům se budou postupně zkoušet a dolaďovat; to, že se báze bude postupně rozrůstat, je samozřejmé. Zatím nelze očekávat rapidní nárůst objemu báze. Rádi bychom do báze zařazovali záznamy zdrojů, k nimž máme nejprve uzavřenu smlouvu s vydavatelem. Tato činnost je prozatím velmi limitující a v současné době představuje prioritu číslo jedna - nynější "vzorové" smlouvy potřebují po konzultaci s právníky upravit tak, aby byly pro vydavatele jednodušší a současně upravovaly pro uživatele možnost neomezeného přístupu. A bohužel sehnat právníka, který se orientuje v technologii, terminologii a právu na internetu (a případně ještě v legislativě týkající se povinného výtisku), má čas a nevyžaduje příliš vysokou odměnu, je téměř nereálné. Až se podaří posunout dále legislativní otázky, budeme moci věnovat své kapacity, v současné době čítající dva pracovníky, více na výběr a popis zdrojů, i když legislativy se zatím nezbavíme. Konečným cílem, kterého je žádoucí v legislativě dosáhnout, je totiž získat pro české depozitní knihovny právo povinného "výtisku" online zdrojů. (Mimochodem, nenapadá někoho vhodný český termín pro "legal deposit", který by vyjadřoval nejen význam povinného výtisku tištěných dokumentů, ale i novějších dokumentů?)
Připomínky jak k bázi WEB, tak i k celé problematice WebArchivu možno adresovat na moji e-mailovou adresu nebo na webarchiv@nkp.cz.