Trendy ve zpracování elektronických zdrojů
Další ze série seminářů pod souhrnným názvem Moderní informační a komunikační technologie v knihovnictví, který uspořádala STK ve svém školicím středisku 13. listopadu 2001, byl zaměřen na zpracování elektronických (online) zdrojů.
V úvodním referátu hovořil P. Žabička (Moravská zemská knihovna v Brně) obšírně o významu značkovacích jazyků pro zápis metadat elektronických dokumentů obecně. Rekapituloval stručně jejich vývoj do současnosti a charakterizoval nejroznámější metadatová schémata-aplikace jazyka SGML (TEI, EAD, CIMI a ONIX). Vysvětlil dále rozdíl mezi procedurálními značkami, které se používají pro formátování, a významovými značkami, které slouží k zachycení obsahové struktury dokumentu. Značnou pozornost věnoval po zásluze jazyku XML (syntax a sémantika, tzv. jmenné prostory, komplementární technologie - stylový jazyk XSL, nástroje pro odkazování - XLink a XPointer). Jeho vlastnosti prezentoval na základě srovnání s jazykem HTML.
V navazujícím vystoupení F. Vojtášek (Ikaros) představil nejrozšířenější metadatový formát, který je určen především pro webové zdroje - Dublin Core Metadata Element Set. Jeho verze 1.1 z roku 1999 zahrnuje celkem 15 základních prvků (autor, název, vydavatel, identifkátor atd.), které je možné dále specifikovat pomocií tzv. kvalifikátorů (jejich doporučená sada byla zveřejněna v červenci 2000). Dublin Core se dnes uplatňuje při popisu odborných textů, muzejních sbírek, dokumentů veřejné správy. Na příkladech ukázal syntax Dublin Core (v prosté i kvalifikované podobě) pro HTML, RDF/XML a XHTML. K dispozici je množství softwarových nástrojů (komerčních i z kategorie public domain) - generátory metadatových záznamů, konvertory do formátů typu MARC, publikační systémy, předmětové katalogy. Některé z nich se využívají v projektu WebArchiv [4].
Ve svém příspěvku se L. Celbová (Národní knihovna ČR) zabývala vymezením pojmu "elektronický zdroj" (podle ISBD(ER), RFC 2396 a OCLC) a především standardy pro jejich popis (vedle zmíněného ISBD(ER) dále AACR2R, kapitola 9, formát MARC (UNIMARC) a věcné autority). Popis elektronických zdrojů ovlivňují tři hlediska: obsah (data, programy nebo jejich kombinace), způsob zpřístupnění (online či offline) a způsob vydávání (monografie, seriály, jejich části a průběžně aktualizované zdroje). Hlavním pramenem popisu elektronických zdrojů pro údaje o názvu a odpovědnosti, údaje o vydání, nakladatelské údaje a údaje o edici je "titulní obrazovka" či jiný "vnitřní pramen" včetně zdrojového kódu. V údajích o názvu se povinně uvádí obecné označení druhu dokumentu - "elektronický zdroj".
R. Římanová (Národní lékařská knihovna) se podělila o své zkušenosti se zpracováním elektronických časopisů (převážně jde o tituly, které jsou v NLK a dalších knihovnách přístupné v rámci konsorciálních licencí - ProQuest 5000, Springer LINK, ScienceDirect a eIFL Direct). Záznamy ve formátu UNIMARC jsou zařazovány do katalogu knih a periodik NLK (NML) a souborného katalogu zahraničních periodik z oblasti biomedicíny (LSS). U institucí, které přispívají do souborného katalogu, je v adresářové databázi uveden výčet online plnotextových služeb, které mohou využívat. Jedním z pozitivních efektů tohoto experimentu je omezení objednávek kopií prostřednictvím služby JASON. Nevýhodou z uživatelského hlediska je podle R. Římanové poněkud komplikovaný přístup ze záznamu v katalogu k časopisu na serveru producenta, resp. nemožnost přímého propojení časopisu s plnými texty článků u většiny služeb (ProQuest 5000, eIFL Direct a ScienceDirect), takový způsob odkazování je naopak zajištěn u Springer LINK.
Příspěvky P. Žabičky, F. Vojtáška a L. Celbové jsou k dispozici jako soubory v PowerPointu na stránkách projektu WebArchiv [5].