Elektronické zdroje publikované v síti Internet jako součást České národní bibliografie
Registrace a uchovávání českých publikací
Národní knihovna ČR je depozitní knihovnou, odpovědnou za trvalé uchovávání fondu bohemikálních dokumentů jako součásti národního historického a kulturního dědictví. Tyto dokumenty jsou uchovávány v národním konzervačním fondu, jejich registraci zajišťuje národní bibliografie. Součástí České národní bibliografie jsou nejen klasické dokumenty, ale postupem doby se jí staly i netradiční dokumenty.
V České národní bibliografii jsou zachyceny tyto druhy dokumentů:
- knihy (včetně zahraničních bohemik a dizertací)
- periodika
- speciální dokumenty
- kartografické dokumenty- grafické dokumenty- hudebniny- zvukové záznamy- elektronické zdroje články a statě
Vedle tištěných dokumentů na papírovém nosiči se jedná též o dokumenty na novějších druzích nosičů. Národní knihovna ČR získává tyto dokumenty převážně na základě zákonů o povinném výtisku 1, 2, dále nákupem, darem či výměnou.
Registrace a uchovávání elektronických zdrojů
Elektronické zdroje nejsou ovšem pouze dokumenty vydávané na discích, případně jiných fyzických nosičích. Čím dál více dokumentů je přístupných v prostředí digitální sítě, zejména v síti Internet. Každý dokument v síti Internet je z knihovnického hlediska považován za publikovaný 3. Také tyto publikace by měly být tudíž uchovávány jako součást národního historického a kulturního dědictví. Jak ovšem zajistit trvalé uložení a dostupnost virtuálních a mnohdy velmi efemérních dokumentů?
Ve světě (zejména v Kanadě 4, USA 5, 6, 7, Austrálii 8, 9, v evropských severských zemích 10-15, Velké Británii 16 aj.) existuje již několikaletá zkušenost s projekty zaměřenými na sbírky elektronických publikací. V Evropě se za podpory Evropské komise zabývají touto problematikou společné mezinárodní projekty (CoBRA 17, BIBLINK 18, NEDLIB 19), jejichž cílem je stanovit budoucí úlohu evropských národních knihoven ve vztahu k elektronickým publikacím a vytvořit podmínky pro propojení národních bibliografických agentur a vydavatelů elektronických publikací, které by bylo užitečné pro obě strany.
Také Národní knihovna ČR připravila návrh projektu na řešení problematiky získávání, uchovávání a zpřístupňování síťových elektronických publikací a získala finanční podporu Ministerstva kultury ČR na řešení tohoto úkolu v rámci projektů vědy a výzkumu v letech 2000-2001. Jedná se o pilotní projekt, jehož cílem je připravit podmínky pro zachycení dálkově přístupných (síťových) elektronických zdrojů v České národní bibliografii a zajištění jejich trvalého zpřístupnění. Projekt by měl umožnit propojení s fondy elektronických publikací v zahraničí.
V zásadě je třeba řešit několik důležitých problémů:
- určení kritérií pro výběr elektronických zdrojů pro registraci a archivaci v souladu s politikou budování fondů depozitních knihoven (součást národní bibliografie - konzervační fond)
- zajištění trvalého přístupu k vybraným publikacím (archiv, URN)
- získávání elektronických zdrojů pro konzervační fond ("povinný výtisk" nebo dohoda s vydavateli?)
- stanovení podmínek přístupu k archivovaným elektronickým zdrojům (autorské právo)
- ověřování autentičnosti elektronických publikací (autentické verze pro uložení, kontrola a údržba aktuálních vazeb jako součástí uložených dokumentů)
- organizace a řízení virtuálních elektronických publikací, bibliografická kontrola (standardy a nástroje pro ukládání a vyhledávání dat o elektronických publikacích i pro ukládání a vyhledávání primárních zdrojů)
Výběr elektronických zdrojů pro registraci a archivaci
Národní bibliografie by měla registrovat dokumenty v úplnosti, tato úplnost je však i u tradičních dokumentů "výběrová", tzn. že některé typy dokumentů nejsou zahrnuty do konzervačního fondu (např. reklamní tiskoviny, publikace nevydané pro širší veřejnost). Také elektronické dokumenty by měly být registrovány (a event. ukládány v konzervačním fondu) v relativní úplnosti, a to v souladu s celkovou politikou budování fondu příslušné knihovny. V každém případě by se mělo jednat o dokumenty původně elektronické, tedy neměly by být zahrnuty elektronické publikace, které jsou pouhou kopií tištěné verze.
Zajištění trvalého přístupu k elektronickým zdrojům publikovaným v síti
Zajištění dlouhodobého přístupu k síťovým elektronickým publikacím předpokládá kooperaci knihoven, vydavatelů i autorů.
Online elektronické publikace, určené pro dlouhodobé uložení v konzervačním fondu knihovny/-en (podle stanovených kritérií výběru), by se měly ukládat na archivním serveru. S tím souvisí řešení trvalé dostupnosti informací obsažených v dokumentu při změnách nosičů, formátů, software, hardware.
Pro ostatní publikace se počítá alespoň se zajištěním trvalého přístupu ke zdrojům pomocí jednoznačných identifikátorů (URN, DOI) 25, 26, 27. Tyto identifikátory by měly sloužit jako trvalá adresa elektronického zdroje nebo jako obdoba současných mezinárodních standardních čísel používaných pro monografie, seriály a hudebniny (ISBN, ISSN, ISMN). Například protokol URN (unifikovaný název zdroje) by měl vybavit internetové zdroje trvalým jménem, které je nezávislé na lokaci a obecně jednoznačné.
Získávání elektronických zdrojů pro konzervační fond
Ukládání elektronických publikací na archivní server nelze provádět bez souhlasu vydavatele. Ve většině zemí, kde se projekty týkající se uchování těchto zdrojů řešily již v dřívějších letech, bylo uzákoněno (nebo se zákon připravuje) právo depozitních knihoven na "povinný výtisk" a dočasně se řeší archivace těchto dokumentů formou dohody s vydavateli. Povinný výtisk podložený zákonem je obvyklým prostředkem, kterým depozitní knihovny mohou zajistit, aby kulturní dědictví bylo zachováno pro budoucnost.
S archivováním elektronických publikací souvisí stanovení podmínek přístupu k archivovaným elektronickým zdrojům. Zpřístupňování těchto dokumentů musí vyhovovat autorskému právu, tzn. je třeba zajistit ochranu proti neoprávněnému využívání a kopírování archivovaných publikací.
Ověřování autentičnosti elektronických publikací
Pro zjišťování nových verzí elektronických dokumentů publikovaných v síti existují automatické prostředky, které ovšem nejsou schopny posoudit rozsah změn a tudíž stanovit podle určitých kritérií, zda se jedná o skutečnou obsahově novou verzi. Pro konzervační fond je třeba zajistit archivaci původní verze připravené vydavatelem/výrobcem dokumentu.
Ověřování autentičnosti by mohl poměrně snadno napomoci soubor údajů Dublin Core 22-24, který může nabídnout nakladatelům jednoduchý mechanismus pro vyplňování potřebných údajů ve zdroji, včetně indentifikačních údajů pro označení verze publikace.
Také pro vyhledávání změn v internetových adresách (URL) uvedených v dokumentech lze použít automatizovaných nástrojů.
Organizace a řízení virtuálních elektronických publikací
Díky mobilitě a nestabilnosti elektronických informačních zdrojů ve virtuálním prostoru není bibliografická kontrola těchto dokumentů zdaleka tak snadná jako u fyzických nosičů. Potřebnost bibliografické kontroly u síťových elektronických publikací je předmětem intenzivních debat. Oponenti myšlenky knihovnického přístupu, tj. bibliografického zpracování, argumentují, že není v lidských možnostech zachytit veškerou produkci publikací v síti, která stále narůstá a přitom se může neustále měnit. Zvažuje se možnost využití vyhledávacích strojů a velkokapacitních paměťových médií pro průběžné ukládání (archivaci) veškeré produkce. V tomto případě se ovšem z koncepce vytrácí smysl národní registrující bibliografie.
Velké katalogizační agentury (např. OCLC) používají propracované bibliografické standardy jako AACR2, ISBD(ER) a formáty MARC. Využití těchto standardů umožňuje kooperativní zpracování s využitím nadstavbových systémů pro věcný popis a vyhledávání a také integraci tištěných i elektronických zdrojů v jediném knihovnickém systému.
Závažný problém organizace přístupu k síťovým elektronickým zdrojům vzniká z nespolehlivosti internetových adres (URL), které se často mění. Pokud dojde k nekontrolované změně URL, důsledky se projeví ve všech dokumentech uvádějících toto URL (odkazy v dokumentech na webu nebo v bibliografických záznamech). Stabilitu adres nabízí řešení programu IETF (Internet Engineering Task Force) - vývoj identifikátorů URI (Uniform Resource Identifiers), např. URN (Uniform Resource Name) jako trvalý název internetovského zdroje.
Také pro popis síťových informačních zdrojů umístěný přímo v dokumentu bylo potřeba vyvinout jednotný standard metadatových prvků. V současné době se zdá, že se svět knihovníků i pracovníků z oblasti IT sjednotil na souboru metadatových prvků Dublin Core (DC Metadata Set) 20, 21. Jde o obdobu CIP (Cataloging in Publication), které u elektronických publikací může pomocí standardizace metadat obsažených ve zdroji zvýšit kvalitu popisu síťových elektronických zdrojů, sloužit jako kontrolní mechanismus pro jiné knihovny, zlepšit identifikaci a autentičnost vyhledaných zdrojů, napomáhat sdílené katalogizaci i při vyhledávání.
Vyvíjejí se softwarové nástroje umožňující vydavatelům jednoduchý a jednotný zápis potřebných údajů ve zdroji a nástroje pro převod dat z formátu DC do formátu MARC 23, 24.
Příklady zápisu dat v DC a UNIMARC
Vztah DC UNIMARC (schéma)
Název 200 $a Hlavní název /Title/ 200 $e Další názvová informace 510 $a Souběžný název 517 $a Variantní název 530 $a Klíčový název Tvůrce 700 Jméno osoby - primární intelektuální odpovědnost /Creator/ 701 Jméno osoby - alternativní intelektuální odpovědnost 710 Jméno korporace - primární intelektuální odpovědnost 711 Jméno korporace - alternativní intelektuální odpovědnost Předmět 606 $a Věcné téma použité jako předmět /Subject/ 610 $a Volně tvořené předmětové termíny 675 $a MDT Popis 330 $a Anotace /Description/ Vydavatel 210 $c Jméno nakladatele /Publisher/ Přispěvatel 702 Jméno osoby - sekundární intelektuální odpovědnost /Contributor/712 Jméno korporace - sekundární intelektuální odpovědnost Datum 210 $d Datum vydání /Date/ Typ 608 $a Forma, žánr či fyzické vlastnosti dokumentu použité jako předmět /Type/ Formát 230 $a Označení a rozsah zdroje /Format/ 336 $a Poznámka k typu zdroje Identifikátor 010 $a ISBN /Identifier/ 011 $a ISSN 856 $u URL 856 $g URN Zdroj 324 $a Poznámka o původní verzi díla /Source/ Jazyk 101 $a Jazyk popisné jednotky /Language/ Vztah 300 $a Všeobecná poznámka /Relation/ Pokrytí 300 $a Všeobecná poznámka /Coverage/ Práva 300 $a Všeobecná poznámka /Rights/
Vztah DC UNIMARC (data)
Název 2001# $a Ikaros /Title/ 2001# $e elektronický časopis o informační společnosti 5300# $a Ikaros Tvůrce 71002 $a Ikaros $c redakce $4 260 $4 650 /Creator/ Předmět 6060# $a Internet $x knihovnictví /Subject/ 6060# $a elektronické publikování 675## $a 004.738.5 675## $a 021 675## $a 070.486 675## $a (051) Popis 330## $a Vydává skupina studentů i absolventů Ústavu informačních studií /Description/ knihovnictví FF UK. Záměrem redakce je přiblížit problematiku Internetu i další témata. Vydavatel 210## $c Ikaros /Publisher/ Přispěvatel 702#1 $a Jedličková $b Petra $4 651 /Contributor/ 71202 $a Albertina icome Praha $4 205 Datum 210## $d 1997- /Date/ Typ 608## $a elektronické publikace /Type/ 608## $a odborné časopisy Formát 230## $a Časopis /Format/ 336## $a Formát HTML; 63 KB Identifikátor 011## $a 1212-5075 /Identifier/ 8564# $u http://www.ikaros.cz 8564# $u http://ikaros.ff.cuni.cz Jazyk 1010# $a cze /Language/ Práva 300## $a Copyright 1998-2000 Ikaros /Rights/
Zápis údajů DC v hlavičce HTML dokumentu
Srovnání formátů UNIMARC a Dublin Core
- Záznamy UNIMARC obsahují data formulovaná katalogizačními pravidly a detailně strukturovaná (stroji srozumitelné informace o dokumentu, slouží pro vyhledávání dokumentů v komplexních bibliografických bázích dat)
- Dublin Core má jednoduchá pravidla - formát méně specifikovaný a strukturovaný (stroji srozumitelné informace o webovském zdroji, slouží pro vyhledávání zdrojů na Internetu)
Závěr
Na většinu složitých činností souvisejících se získáváním, zpracováním, ochranou a zpřístupňováním elektronických zdrojů lze použít speciálních softwarových a hardwarových prostředků, které lidskou práci dokonale nahradí, nebo alespoň usnadní, a přispějí k vyšší kvalitě. Nicméně, pokud mají být i dálkově přístupné elektronické zdroje registrovány v národní bibliografii a stát se součástí národního konzervačního fondu, bude zde hrát i nadále podstatnou roli intelektuální lidská činnost.
Použité informační zdroje
- Zákon č. 37/1995 Sb. o neperiodických publikacích. (Zpět do textu)
- Zákon č. 46/2000 Sb. o právech a povinnostech při vydávání periodického tisku a o změně některých dalších zákonů (tiskový zákon). (Zpět do textu)
- ISBD(ER) : mezinárodní standardní bibliografický popis pro elektronické zdroje. Praha : Národní knihovna ČR, 1998. (Zpět do textu)
- National Library of Canada Electronic Collection [online]. [Ottawa (Kanada)] : NLC, revised 1998-03-20 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://collection.nlc-bnc.ca/e-coll-e/index-e.htm. (Zpět do textu)
- Internet Cataloging Project : Call for Participation [online]. Dublin (Ohio, USA) : OCLC, 1996 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.oclc.org/oclc/man/catproj/catcall.htm. (Zpět do textu)
- Preservation Resources [online]. Dublin (Ohio, USA) : OCLC, c1998, last updated March 9, 2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.oclc.org/oclc/presres/. (Zpět do textu)
- InterCAT : a Catalog of Internet Resources [online]. Dublin (Ohio, USA) : OCLC [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://orc.rsch.oclc.org:6990/. (Zpět do textu)
- PANDORA Project : Preserving and Accessing Networked Documentary Resources of Australia [online]. Canberra (Austrálie) : National Library of Australia, last updated 10-Apr-2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://pandora.nla.gov.au/pandora/. (Zpět do textu)
- National Strategy for Provision of Access to Australian Electronic Publications: A National Library of Australia Position Paper [online]. Canberra (Austrálie) : National Library of Australia, last updated 07-Dec-1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.nla.gov.au/policy/paep.html . (Zpět do textu)
- INDOREG. Internet Document Registration Project Report [online]. Ballerup (Dánsko) : Dansk Biblioteks Center, 1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.purl.dk/rapport/html.uk. (Zpět do textu)
- Kulturarw3 Heritage Project [online]. Stockholm (Švédsko) : Royal Library, 1998-1999, updated 1999-06-09 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.svesok.kb.se/info. (Zpět do textu)
- Projects at the Royal Library in Stockholm, Sweden [online]. Stockholm : Royal Library, updated July 1, 1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.kb.se/ENG/projekt.htm. (Zpět do textu)
- HAKALA, Juha. Description of the Nordic Metadata project : Cataloguing, Indexing and Retrieval of Digital Documents [online]. Helsinki (Finsko) : Helsinki University Library, [1996] [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://linnea.helsinki.fi/meta/projplan.html. (Zpět do textu)
- Expert centre - National Library [online]. Haag (Holandsko) : National Library of the Netherlands [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.kb.nl/kb/resources/frameset_kenniscentrum-en.html. (Zpět do textu)
- EVA : the acquisition and archiving of electronic network publications [online]. Helsinki (Finsko) : Helsinki University Library, updated 1997-12-15 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://renki.helsinki.fi/eva/english.html. (Zpět do textu)
- Metadata [online]. Bath (Anglie) : UKOLN, last updated 16-Feb-2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.ukoln.ac.uk/metadata/. (Zpět do textu)
- Cobra+ : Computerised Bibliographic Record Actions [online]. Boston Spa (Velká Británie) : COBRA+, 1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://portico.bl.uk/gabriel/en/projects/cobra.html. (Zpět do textu)
- Biblink [online]. Bath (Anglie) : UKOLN, last updated 12-Oct-1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://hosted.ukoln.ac.uk/biblink/. (Zpět do textu)
- NEDLIB - Networked European Deposit Library [online]. Den Haag : Koninklijke Bibliothek, [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.kb.nl/coop/nedlib/. (Zpět do textu)
- Dublin Core Metadata Initiative [online]. Dublin (Ohio, USA) : OCLC, c2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://purl.org/dc/. (Zpět do textu)
- Dublin Core Czech [online]. Brno : Masarykova univerzita, c1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.ics.muni.cz/dublin_core/DC-czech.html. (Zpět do textu)
- The Nordic Metadata projects [online]. Helsinki (Finsko) : Helsinki University, 1996, last updated 21 February 2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://linnea.helsinki.fi/meta/. (Zpět do textu)
- KOCH, Traugott; BORELL, Mattias. Dublin Core Metadate Template [online]. Lund (Švédsko) : Lund universitetsbibliotek, 1997, last update 1997-08-20 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.lub.lu.se/metadata/DC_creator.html. (Zpět do textu)
- d2m : Dublin Core to MARC converter [online]. Trondheim (Norsko) : BIBSYS, 1998, last update 1998-05-18 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.bibsys.no/meta/d2m. (Zpět do textu)
- Nordic Countries URN-generator : provided by the Nordic Libraries [online]. Lund (Švédsko) : Lund universitetsbibliotek, 1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.lub.lu.se/cgi-bin/nmurn.pl. (Zpět do textu)
- DOI, the Digital Object Identifier System [online]. Kidlington (Oxford, Velká Británie) : International DOI Foundation, 1998, updated 4 April 2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.doi.org/ . (Zpět do textu)
- Uniform Resource Names (urn) Charter [online]. Reston (VA, USA) : IETF, last modified 03-Jun-99 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.ietf.org/html.charters/urn-charter.html. (Zpět do textu)
- OLSON, Nancy B. Cataloging Internet Resources [online]. Second edition. Dublin (Ohio, USA) : OCLC, c1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: http://www.purl.org/oclc/cataloging-internet.