Kooperační systém článkové bibliografie - stručný vývoj, stav v r. 2008 a perspektivy
1. Vývoj článkové bibliografie v letech 1953-2006, Kooperační systém článkové bibliografie, projekty [3, snímky 2-39]
Kooperační systém článkové bibliografie vznikl před 16 lety, tj. v r. 1992. V 50. až 80. letech vycházela článková bibliografie v tištěné formě, v r. 1990 vyšel takto Bibliografický katalog ČSFR Články v českých časopisech naposledy. Rok 1991 byl převeden do počítačové formy a v r. 1992 bylo zahájeno experimentální počítačové zpracování analytických záznamů nejprve v NK ČR a následně ve státních vědeckých knihovnách. Knihovny pravidelně zasílaly dávky zpracované v systému ISIS na disketách a ty se importovaly do databáze. Od r. 1994 postupně přistupovaly do systému odborné knihovny. Velmi cenná z hlediska historického je i oborová kartotéka článků zahrnující léta 1948-1952 a různé bibliografie vydávané v tištěné formě. Od r. 1998 byly záznamy o článcích převáděny konverzí do ALEPHu, která byla vypracována v rámci projektu RISK Zpřístupnění výsledků analytického zpracování prostřednictvím Internetu. Již v tomto projektu bylo konstatováno, že propojení na volné www texty je krajně nespolehlivé (různá retrospektiva a úplnost vystavovaných plných textů, různé strategie vystavování, změna struktury archivů apod.).V r. 1999 byla vypracována první verze příručky Metodika popisu článků ve formátu UNIMARC a byly formulovány základní principy věcného popisu: klíčová slova a k nim nadřazený a podřazený pojem ve vazbě na MDT, které později tvoří tzv. (analytické) předmětové kategorie. Po roce 2000 se zpracovávaly články v UNIMARCu v systému ALEPH a postupně vznikala aplikace pro upload záznamů do kooperačního systému. V r. 2004 přešlo počítačové zpracování na MARC 21. Podobnými peripetiemi přechodů od jednoho formátu ke druhému procházely a procházejí kooperující instituce dodnes. Výsledkem práce systému je báze ANL známá též pod názvem Články v českých časopisech novinách a sbornících, která vychází pravidelně jako ČNB na CD/DVD. Dřívější tištěná podoba báze nutila k větší preciznosti dat. Je ale třeba podotknout, že oddělení analytického zpracování mívalo dvojnásobný počet pracovníků. Na druhé straně nebyly např. k dispozici soubory autorit tak, jak je známe dnes.
V rámci systému se řešily během doby různé projekty. V NK ČR to v letech 1999-2004 byly dva projekty: výzkumný záměr Propojení analytických záznamů s plnými texty a optimalizace zpřístupnění plných textů a praktický projekt Souborná databáze kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat.
Po analýze titulové základny systému a plnotextových zdrojů na internetu bylo v projektech rozhodnuto:
a) deníky a některé odborné časopisy zpracovávat v lince poloautomatické indexace TTDE (TamTam Data Extractor) z plných textů Anopress (v textech jsou obsaženy základní údaje jmenného popisu) za současného doplnění věcného popisu; vyvinout dvě verze linky, linku pro lokální pracovní stanice, tj. Windows linku, a www linku pro práci online na internetu; metadata z linky zasílat do báze ANL, plné texty se stejnými metadaty naopak do plnotextové databáze ANL FULL; další seriály zpracovávat v systému ALEPH,
b) analytické záznamy odborných volně dostupných periodik obsažených v db ANL propojovat zatím staticky s volnými plnými texty na WWW,
c) vytvořit portál WWW periodik ve struktuře regionální a odborné, který by zahrnoval české plnotextové zdroje,
d) vytvořit aplikaci pro management kooperačního systému.
Na serveru http://full.nkp.cz/ [7] tak vzniklo několik aplikací.
Ad a) Plnotextová databáze ANL FULL s plnými texty novin a časopisů Anopress; plné texty Anopress byly v letech 2001-2004 stahovány z databáze TamTam a zpracovány v lince TTDE, z textů se extrahovala jmenná metadata, která se, po doplnění věcných dat, zasílala do databáze ANL a zároveň se ukládala i do plných textů databáze ANL FULL. Z dat uložených v lince TTDE se generovalo několik formátů - DC, XHTML a XML kvalifikovaný a nekvalifikovaný, UNIMARC, v www verzi linky i MARC 21, později pak formát RSS. WWW linka byla také přes Z39.50 propojena na autority. Automaticky se generoval link propojující záznamy v bázi ANL na plné texty ANL FULL, z identifikátorů jmenujme automaticky generovaný SICI a NBN u každého záznamu, resp. plného textu.
Údaje DC vycházely z rozsahu dat minimálního záznamu pro soubornou databázi pro nesamostatné části dokumentů (článků) a z nutné přítomnosti prvků věcného popisu v záznamech. Pro články bylo využito 14 prvků DC z 15 a 14 prvků ANL CORE definovaných pro vyhledávání a užívaných v popisu článku. Nebyla aplikována data administrativní a technická. Pro vyhledání v databázi ANL FULL byly definovány tři formuláře, 17 rejstříků a tzv. topiky, tj. předdefinované strukturované dotazy pro vyhledávání v plných textech, které konvenovaly lexice MDT a lexice vyskytující se v novinách a některých vybraných časopisech. Byly nadefinovány tři úrovně topiků: základní tematické oblasti (8), skupiny témat (28), detailní témata (197). Mohou tvořit základ budoucích ontologií. Nebyly řešeny otázky autorského práva a archivace dokumentů (pouze klasické zálohy na pásce či DVD).
Plné texty byly od firmy Anopress zakoupeny. Provizorní smlouva, která byla s Anopressem uzavřena, nebyla dále prodloužena. Externím uživatelům jsou zpřístupňována pouze metadata, interní uživatelé NK ČR mohou plné texty prohlížet a tisknout pro svou osobní potřebu, jak je uvedeno na adrese http://full.nkp.cz/nkdb/docs/upozorneni_aut.htm [8].
Technologicky byl však vyřešen export a stahování vyhledaných článků na počítač uživatele.
V současné době je ANL FULL v udržovacím chodu a plné texty jsou zpřístupňovány interním uživatelům v NK ČR. Od r. 2005 bylo rozhodnuto v NKČR ukládat záznamy novin a některých časopisů zpracovávaných v letech 2001-2004 v TTDE opět ručně v ALEPHu a propojovat je přímo na databázi Anopress přes de facto statický odkaz, ke kterému je v Referenčním centru NKČR připojováno ID článku (oddělení analytického zpracování z finančních důvodů byly odebrány licence pro stahování plných textů Anopress do linky TTDE). Uvažovalo se o tom tento odkaz generovat dynamicky dle příslušného uživatele. Nevím, do jaké míry bylo toto řešení průchodné. Rovněž tak není dosud uzavřena smlouva o zpřístupnění plných textů Anopress z databáze ANL. Proto nejsou odkazy na bázi Anopress v současné době, resp. v době psaní tohoto textu, aktivní. Po skončení projektů se také uvažovalo o zapojení databáze Anopress jako takové do JIB.
V projektech byla ověřena hypotéza, že vyhledávání v klíčových slovech plných textů je velmi nepřesné a zavádějící. U běžných plnotextových systémů nepostihuje pojmy, koncepty. Řešením může být kombinace vyhledávání dle metadat (dle řízených slovníků) s pojmovým (realizováno), podpořené lemmatizátorem (již nerealizováno), tvorba clusterů při vyhledávání (tj.seskupených záznamů podle společného příznaku, realizováno) a tvorba ontologií (náznak v topikách). Žádoucí je i interakce uživatelů při tvorbě topiků. V projektu nebylo realizováno vyhledávání podle určitého textu, tzv. free text query, které systém též nabízel a které by zvýšilo komfort vyhledávání.
Z teoretických prací připomeňme studii Současný stav a trendy automatické indexace dokumentů [9].
Ad b), ad c) V rámci projektů vznikl na serveru http://full.nkp.cz/ [7] též portál Periodika na www – možný základ systematického podchycení článků a seriálů vycházejících v ČR a zpřístupňovaných na www a výchozí vzorek pro archivaci textů. Aplikace pro odborná a regionální periodika umožňuje přehlednou identifikaci zdrojů na internetu, HTML stránka Statistika 1 [10] obsahuje stav propojení záznamů db ANL na texty databáze ANL FULL, resp. Anopress, Statistika 2 [11] obsahuje stav propojení záznamů db ANL na volná www periodika. Na adrese http://full.nkp.cz/nkdb/docs/zdroje.htm [12] jsou průběžně monitorovány zdroje, které souvisejí se zpřístupňováním článků a/nebo seriálů. O aplikaci dále v bodě 2.
Ad d) Na adrese http://anl.nkp.cz:2100/r/SKK/p210/p10Init [13] byla vytvořena důležitá aplikace pro management kooperačního systému (MNG KOSABI), díky níž probíhají pravidelné uploady do báze ANL. Aplikace byla později převedena na volně dostupný SW. Ve vývoji je aplikace pro online evidenci excerpční základny systému. O aplikaci dále v bodě 2.
V r. 2004 byly podány neúspěšně dva projekty v rámci programu 1N MŠMT Informační infrastruktura výzkumu, které dále rozvíjely předešlé projekty a které se týkaly zpřístupnění odborných zdrojů, implementace rozhraní OpenURL pro bázi ANL FULL a lingvistického analyzátoru pro český jazyk do systému vyhledávání.
2. Kooperační systém článkové bibliografie, články v ČR - stav v r. 2007, aktualizace informací pro jaro 2008 [3, snímky 40-87]
2.1 Články obecně, články v ČR a Kooperační systém článkové bibliografie [3, snímky 41-60]
Obecně zdroje informací o článcích mohou být zaměřené univerzálně, na konkrétní obor, téma, osobu, na region, oblast apod. a mohou mít různou formu (databáze, katalogy, citační rejstříky, souborné katalogy, časopisy začleněné do portálů, články v rámci zpravodajských serverů, archivů, samostatné časopisy, publikační činnost na stránkách různých institucí apod.) V současné době jsou článkové bibliografie zpřístupňovány elektronicky, některé bibliografie jsou dosud dostupné pouze v tištěné podobě nebo v kartotéce. Z hlediska přístupnosti mohou být zdroje přístupné online, zdroje lokálně přístupné, vzdáleně a volně přístupné, licencované, přes jméno a heslo, v rámci konzorcií, placené databáze. Mohou je zpřístupňovat různé společnosti i jednotlivci, elektronická nakladatelství/vydavatelství i jiní producenti a distributoři, v poslední době jsou populární otevřené archivy (open archives) a otevřená seskupení na základě společné domluvy. Z některých databází systémů a aplikací lze exportovat záznamy v různých citačních stylech.
Komplexně lze přistoupit k článkům, resp. elektronickým seriálům na stránkách některých knihoven, vysokých škol, AV ČR a jiných institucí, přes abecedně uspořádaná rozhraní fungující často na principu SFX. Nepřehlédnutelným zdrojem článkových informací je publikační činnost univerzit, knihoven, ústavů a jiných institucí.
K seriálům jako takovým lze v nabídce NK ČR přistoupit z položky Jak najít .. Noviny a časopisy z adresy http://www.nkp.cz/pages/page.php3?page=sluz_jaknajit_casopisy.htm [14]. Seriály jsou v NK ČR zpřístupňovány v databázi NKC/Seriály [15], v Souborném katalogu [16] a jiných zdrojích. V rámci Národní digitální knihovny na http://www.ndk.cz/narodni-dk [17] jsou přístupny v aplikaci Kramerius (open source aplikace pro zpřístupnění digitalizovaných dokumentů). Obsah českého webu archivuje aplikace WebArchiv.
České články jsou v NK ČR přístupné z položky Jak najít .. Články na adrese http://www.nkp.cz/pages/page.php3?nazev=clanky&submenu2=106 [18]. Jsou zde uvedeny i odkazy na oborové [19] a regionální [20] článkové databáze.
Systematicky jsou články zpřístupňovány v rámci souborné databáze ANL [21], resp. Kooperačního systému článkové bibliografie. Plné texty, které jsou navázány na záznamy ANL zpracované v letech 2001-2004, jsou obsaženy v bázi ANL FULL [7].
Prostřednictvím vzdáleného přístupu NK ČR jsou některé databáze k dispozici na adrese http://www.nkp.cz/pages/page.php3?page=vzdal_pristup.htm [22].
V ČR jsou dále články zpřístupňovány v Souborném katalogu článků SKAT [23], v Centrálním katalogu Univerzity Karlovy v Praze [24], v Katalogu článků MU [25], v AV ČR [26] apod. ANL články jsou přístupné přes JIB [27] a v již existujících oborových branách ART [28], MUS [29], KIV [30] a v branách postupně vznikajících.
Seznam zdrojů článkových informací a souvisejících zdrojů je na již zmíněné adrese http://full.nkp.cz/nkdb/docs/zdroje.htm [12].
V Kooperačním systému článkové bibliografie [31] spolupracují: NK ČR, krajské knihovny (užší kooperační systém) + odborné a specializované knihovny a instituce (Státní technická knihovna, Národní pedagogická knihovna, Ústav zemědělských a potravinářských informací, Národní filmový archiv, začíná Divadelní ústav, tj. širší kooperační systém). Součástí kooperačního systému je i Národní lékařská knihovna, která však do systému nepřispívá. Faktická kooperace spočívá zejména v rozdělení titulů ke zpracování po linii regionální a oborové, dále pak v metodice zpracování a v pravidelných dávkách dat do souborné databáze ANL. Virtuální kooperace spočívá pouze v delimitaci titulů.
V rámci systému vzniká řada kontaktů dalších, žádoucí je spolupracovat zejména s vysokými školami, archivy, se sítí muzeí a galerií, s městskými knihovnami a jinými institucemi, dále pak vyjasnit vztah se SKAT a dalšími soubornými katalogy a databázemi.
Celkem spolupracuje rutinně 16 institucí (včetně NK ČR), u čtyř institucí je pouze (někde zatím) dohodnuta delimitace titulů, s dvanácti institucemi je navázán kontakt nebo se spolupráce testuje nebo se spolupracuje metodicky. Současný stav kooperace je charakterizován na adrese http://anl.nkp.cz:2100/docanl/pozn_tituly.htm [32].
Cílem kooperačního systému je v současnosti pokrýt výběrově produkci v ČR a rozšiřovat spolupráci tak, aby nedocházelo k duplicitám a k mezerám ve zpracování. Do budoucna je to co nejspolehlivější propojení na plné texty a co nejúplnější zpřístupnění plných textů především seriálových dokumentů a šedé literatury vydávané na území ČR, spolupráce s dalšími soubornými katalogy a databázemi, eventuálně projekty, zapojení se do mezinárodní kooperace. Plné texty by měly být spolehlivě archivovány. O kooperačním systému viz též bod 2.3 a 3.
Produktem systému je multioborová báze ANL se zaměřením na společenské a přírodní vědy (okrajově obsahuje lékařství a sport). Kromě ní vznikají v rámci systému i lokální databáze spolupracujících knihoven. Báze ANL vychází též na CD/DVD jako Česká národní bibliografie Články v českých novinách, časopisech a sbornících a je vystavována též na adrese http://aip.nkp.cz/ [33]. V příštím roce se chystají změny ve zpřístupnění ČNB.
2.2 Excerpční (titulová) základna, druhy dokumentů, organizace databáze ANL, nakladatelé, vydavatelé a autoři v kooperačním systému [3, snímky 61-75]
V ANL jsou zahrnuty záznamy o článcích a statích obsažených především v periodicky vydávaných dokumentech (seriálech) na území ČR: články s faktografickou a uměleckou hodnotou, biografické a jubilejní články, literární texty, recenze, reportáže, akce, rozhovory, komentáře, polemiky, diskuse apod.
Titulová (excerpční základna systému) je dělena do čtyř skupin, každá skupina má stanovenou míru úplnosti excerpce, vždy však záleží na obsahu konkrétního titulu:
A: seriály (časopisy, sborníky, ročenky) vydávané AVČR a vysokými školami v ČR
B: seriály (časopisy, sborníky, ročenky) vydávané ostatními institucemi v ČR
C: noviny (ústřední, regionální) a kulturně politické časopisy
D: populárně naučné časopisy
Úplnost excerpce a kategorie titulů:
A: 1 (100-80 %)
B: 1 (sborníky, ročenky 100-80 %), 1-2 (odborné časopisy 100-80-25 %)
C: 2, 3 (80-25, někdy méně %)
D: 3 (25-méně %)
V současné době je kladen větší důraz na zpracování odborných titulů. Čisté monografie jsou zpracovávány sporadicky.
Excerpční základna v číslech k 15. 5. 2008:
Seriály zpracovávané v aktuálním roce: celkem 1 055 aktuálně zpracovávaných seriálů (včetně NLK, která má oddělenou bázi, dále včetně krajských knihoven v Pardubicích, Zlíně a Karlových Varech, které momentálně do ANL nepřispívají – cca 423 titulů).
Instituce přispívající do ANL zpracovávají aktuálně cca 632 seriálů, z toho 130 seriálů zpracovávají speciální a odborné knihovny, 279 krajské knihovny, 209+14 NK ČR.
Další tituly (seriály s řídkou periodicitou, monotematická/monografická čísla seriálů apod. od r. 2000): cca 404 titulů, z toho 105 v odborných a speciálních knihovnách, 97 v krajských knihovnách, 202 v NK ČR.
Je třeba důkladně zmapovat seriály a další tituly zpracovávané pro lokální databáze.
Evidence titulů je na adrese http://full.nkp.cz/nkdb/docs/tituly_napoveda.htm [34] v bodě 3. Zatím v testovací podobě je online verze. O evidenci titulů viz též bod 2.3.
V kooperačním systému jsou zpracovávány v současné době především články a statě české tištěné seriálové produkce, články některých seriálů jsou pravidelně propojovány na elektronickou verzi (viz též bod 1. b). Patnáct titulů se pravidelně napojuje na bázi Anopress. Cca 100 titulů je propojováno z tištěných článků na jejich www elektronické verze.V r. 2006 bylo zpracováno výběrově cca jedenáct titulů offline zdrojů (CD- ROM). Statistiky ANL viz dále bod 2.3.
U titulů propojovaných na plné texty jsou na již zmíněných adresách (http://full.nkp.cz/nkdb/docs/stat_1.htm [10], http://full.nkp.cz/nkdb/docs/stat_2.htm [11]) uvedeni pro ilustraci někteří nakladatelé/vydavatelé, se kterými by mohla být v budoucnu navázána spolupráce.
Souborná bibliografická databáze KOSABI ANL [35] je dělena na dílčí databáze dle tematiky, je vyčleněna také databáze plných textů (elektronických zdrojů).
Základní dělení databáze ANL je na deníky, seriály, monografie dle pole FMT (RD, RS, RM), pro popis offline dokumentů a online dokumentů (včetně elektronických verzí tištěných dokumentů) zvoleny kódy OF a ON v pomocném poli PSP.
Periodika s řídkou periodicitou jsou obsažena jak v dílčí bázi seriály, tak dílčí bázi monografie. V budoucnu je třeba provést revizi báze ANL a bázi dělit na seriály včetně seriálů s řídkou periodicitou (1x za 3 roky), monografických edic a na čisté monografie. O FMT viz též bod 2.4.
2.3 Aplikace pro management KOSABI [3, snímky 76-87, 30-38]
Návod jak kooperovat je na adrese http://full.nkp.cz/nkdb/docs/tituly_napoveda.htm [34]. Aplikace pro management kooperačního systému obsahuje dílčí nástroje pro vedení titulové základny, aplikaci pro upload/import záznamů do pomocné báze ANL /SKA, aplikaci pro administraci systému (jen pro administrátora) včetně možnosti kontroly platnosti URL adres. Přístupná je z http://full.nkp.cz/ [7] nebo z již zmíněné adresy http://anl.nkp.cz:2100/r/SKK/p210/p10Init [13]. Aplikace byla převedena na volně dostupný software. Každá spolupracující instituce má své jméno a heslo. Bylo nadefinováno deset formátů dat a devět variant kódů. Další info je na adrese http://anl.nkp.cz:2100/docanl/pozn_upl.htm [36].
Po přihlášení se do systému se automaticky nastaví potřebný formát a kód dat, data se mohou odeslat. Data jsou v současné době přijímána v UNIMARCu a MARCu 21 (je zachována možnost i pro ISIS).
Provádějí se kontroly na UNIMARC a MARC 21. Data v UNIMARCu procházejí ještě konverzí dat do MARCu 21 vně aplikace.
Pro každou instituci se objeví příslušné statistiky dat s označením chyb v dávce. Podle výpisu ve statistikách u jednotlivých dávek lze záznamy opravit a znovu uploadovat. Některé dávky opravuje správce systému sám, některé zasílají instituce znovu.
V rámci uploadu se vytvářejí globální statistiky všech akcí. Správce báze ANL vede evidenci importů do báze (statistiky uploadu do pomocné báze ANL/SKA a zároveň importu do báze ANL jsou dostupné na adrese http://anl.nkp.cz:2100/docanl/stat_imp.htm [37]).
Obsah báze ANL k 31. 3. 2008, databáze ANL FULL a stav propojení na plné texty z databáze ANL: v ANL obsaženo cca 1 110 398 záznamů, v ANL FULL cca 130 000 plných textů. V databázi ANL je napojeno na plné texty přibližně cca 234 000 záznamů: z toho cca 125 000 záznamů je napojeno na databázi ANL FULL, z toho přímo na databázi Anopress je napojeno cca 45 990 (dohromady na texty Anopress tedy připadá 170 990 propojení), z toho na volné www texty napojeno cca 62 280 záznamů.
K 15. 5. 2008 bylo napojeno na plné texty cca 235 291 záznamů, na texty Anopress celkem cca 172 214 záznamů (z toho 120 000 na databázi ANL FULL), na volné www texty cca 63 077 záznamů. Odkazy na statistiky viz bod 1 b) c).
V r. 1999 tvořil podíl NK ČR v bázi ANL cc 77 %, v r. 2007 69-70 %. K dispozici je také grafické zobrazení poměru zpracovávaných záznamů v rámci KOSABI - srovnání poměru v r. 1999 a 2007 [38].
2.4 Standardizace a metodika článků [3, snímky 88-170]
Tak, jak se vyvíjel kooperační systém, vyvíjela se i metodika popisu článků. Od pravidel zápisu údajů pro analytický popis v r. 1992 až po vystavená pravidla zápisu pro UNIMARC (nutno aktualizovat zejména s ohledem na popis elektronických zdrojů a standardní pole v 4XX) a MARC 21 na adrese http://www.nkp.cz/pages/page.php3?page=oazp_metodika.htm [39]. Tato pravidla je třeba zpřehlednit a v určité etapě vývoje vydat i tištěnou formou. Vzhledem k tomu, že pravidla RDA jsou plánována na r. 2009, nabízí se termín až po tomto datu. Metodika je poměrně podrobně rozebrána v již zmíněné prezentaci.
Za významný považuji materiál týkající se minimálního záznamu, kde jsou nastíněny i shody a rozdíly mezi minimálním záznamem pro UNIMARC [40] (1999) a MARC 21 [40] (2004). V prezentaci je uvedeno i rozšířené schéma ISBD pro ČNB, které je v databázi ANL většinou aplikováno [3, snímek 109].
Z mezinárodního pohledu se metodikou článků zabývá především doporučení ISBD, v rámci UNIMARCu potom doporučení pro popis článků. Pravidla AACR2R řeší analytický popis okrajově, více se jimi zabývá MARC 21 [41]. Zásady popisu pro jiné druhy dokumentů lze však v analytickém popisu dobře uplatňovat. Hypoteticky může být metodika analytického popisu na mezinárodním poli rozvinuta v budoucnu v rámci připravovaných pravidel RDA [42], v rámci konceptu FRBR [43].
Ve jmenném popisu je obecně patrná tendence někde ustupovat od interpunkce ISBD, akcent se klade na selekční prvky (nerozlišuje se hlavní a vedlejší záhlaví), a tudíž na soubory autorit, unifikované názvy, role, jednoznačnou identifikaci, homogennost dat a přesnost jejich zápisu. Cílem je „optimalizovat“ bibliografický záznam tak, aby nebyl zbytečně složitý, ale zároveň aby poskytoval důležité informace pro uživatele a byl propojitelný se souvisejícími informacemi.
Analytické záznamy jsou bohatě strukturovány, mezi entitami obsaženými v záznamu jsou mnohočetné vztahy, mnohočetné vztahy jsou i navenek. Jsou vhodným materiálem z hlediska zkoumání konceptu FRBR (variabilita popisovaných dat).V analytickém záznamu je obsažen vztah mezi článkem, zdrojovým dokumentem a recenzovaným dokumentem. Článek může být obsažen v různých druzích a typech zdrojových dokumentů (např. elektronická a tištěná forma, online a offline dokument).
Nejčastěji popisovanými zdroji jsou periodicky vycházející dokumenty (noviny a jejich mutace nebo přílohy, odborné seriály a jejich přílohy, řady seriálů, ročenky, sborníky, monografická čísla seriálů). Pozornost by se měla soustředit na tzv. šedou literaturu. Druh dokumentu analytické jednotky a zdrojového dokumentu se může v některých případech lišit (např. u multimédia).
Kategorizace druhů a typů dokumentů zejména s ohledem na tendence v rámci RDA je klíčová vzhledem k postupnému začleňováním popisu elektronických dokumentů a elektronických verzí dokumentů, popř. i jiných druhů/typů dokumentů do analytického popisu. Jako poměrně šikovné se jeví zapisovat spolu se standardním číslem formu či nosiče dokumentu. V ANL užíváme u elektronických dokumentů ve zdrojovém dokumentu pole/podpole pro fyzický popis pro vyjádření nosiče dokumentu (online, CD-ROM).
V rámci RDA vzniká návrh nové kategorizace dokumentu RDA [42]. (Snahy o restrukturalizaci OODD (obecného určení dokumentu, GMD) a vztah ke specifickému určení druhu dokumentu (SMD), viz též katalogizační dotaz [44]).
Mohou existovat různé typy článků z hlediska obsahu, formy nebo žánru (recenze, polemiky, rozhovory, biografické články, komentáře apod.). Článek může být obsažen v rubrice zdrojového dokumentu. Článek může obsahovat dílčí díla (zápis děl se společným názvem). Článek může recenzovat a nebo se týkat různých druhů/typů děl a dokumentů, divadelních inscenací (činohra, opera, balet, muzikál), akcí, osob. Článek může být průběžně aktualizován, může být krácen. Z hlediska procesu publikování může mít podobu preprintu, reprintu/offprintu/postprintu.
V poslední době se mluví o metodě popisu jedním nebo dvěma záznamy v případě existence tištěných a elektronických podob dokumentu. Při metodě popisu jedním záznamem se k již existujícímu záznamu tištěného dokumentu připojuje odkaz na elektronickou verzi v poli 856 s indikátory 41. Údaje v záznamu se tak týkají obou podob dokumentu. Pokud se popisuje každá podoba zvlášť, uvádějí se údaje buď pro tištěnou nebo elektronickou podobu.
Základní dělení databáze ANL je na deníky, seriály, monografie dle pole FMT (RD, RS, RM), tyto kódy jsou užívány v současné době pro textové dokumenty (LDR/06=a); pro popis elektronických offline dokumentů a online dokumentů s polem 856 s indikátory 40 (původní elektronický zdroj) a včetně tištěných dokumentů a jejich elektronických verzí v poli 856 s indikátory 41 popisovaných jedním záznamem jsou stanoveny kódy OF a ON v pomocném poli PSP.
U elektronických offline a online dokumentů se uvádí výraz elektronický zdroj v názvových údajích v podpoli pro druh dokumentu. Pokud se popisuje jedním záznamem tištěný zdroj a jeho elektronická verze (podoba), výraz elektronický zdroj se neuvádí. V r. 2008 bylo zavedeno zatím zkušebně vedlejšího záhlaví v poli 776 u vybraných online elektronických verzí tištěných zdrojů.
U elektronických zdrojů offline, online se uvádí pole MARC 007 (pole pevné délky pro fyzický popis) a UNIMARC 135 (pole kódovaných údajů pro počítačové soubory). U elektronických zdrojů offline a online se uvádí v poli MARC 008, pozice 23 kód s pro elektronickou podobu.
U tištěných zdrojů a jejich elektronických verzí popisovaných v jednom záznamu jsme začali používat též pole 007 pro elektronickou verzi, která je napojena v poli 856 s indikátory 41. Použití pole 007, eventuálně pole 006 se bude ještě vyvíjet. Pole 007 pro elektronickou podobu zapisujeme zatím u článků z několika časopisů v r. 2008.
“Čisté“ elektronické zdroje (počítačový software, číselná data, počítačově orientovaná multimédia, systémy online a síťové služby) a další speciální druhy dokumentů se v bázi ANL zatím na úrovni analytického záznamu nepodchycují, pouze ve věcném popisu jako recenzovaná nebo jiná díla:
- 1107774 [45] (Ludwig van Beethoven - Klavírní koncerty č. 1 C dur op. 15 a č. 3 c moll op. 37).
Z hlediska analytického zpracování je třeba vyzkoušet a navrhnout popis elektronických integračních zdrojů (databází, webovských sídel apod.).
Do jaké míry se podobné zdroje budou analyticky popisovat, ukáže budoucí vývoj.
Poslední stav zápisu elektronických dokumentů a elektronických verzí tištěných dokumentů dokumentů v bázi ANL je vidět např. na záznamech (uvedeno sysno s názvem, někde komentář):
- 1013659 [45] (Zur Position der Austriazismen in der österreichischen Mediensprache. Aktuelle Tendenzen im wandelnden europäischen Kontext; článek z CD-ROMu),
- 1085005 [45] ([Nils Lennart Wallin: Biomusicology: Neurophysiological, Neuropsychological and Evolutionary Perspectives on the Origins and Purposes of Music]; článek z online časopisu),
- 1107822 [45] (Neodpovíte-li, pochopím - Karel Ančerl; elektronická verze tištěného článku, vedlejší záhlaví pro online verzi, variantní název pro název z obsahu),
- 1116686 [45] (Polysacharidy III: "Analýza, reakce a biologické účinky polysacharidů a jejich derivátů, inženýrské aspekty produkce na bázi polysacharidů"; elektronická verze tištěného časopisu, tištěná i elektronická podoba má vlastní ISSN, plný text umístěn na dvou adresách, vytvořena vedlejší záhlaví článku pro online verzi článku, variantní názvy).
Záznamy propojené na plný text v databázích Anopress a ANL FULL:
- 1117473 [45] (Tajemství svatého psa),
- 885388 [45] (Šmok vsadil na klasickou baletní pohádku),
- 780107 [45] (Jak by se Peroutka díval na dnešní stát),
- 886155 [45] (Agrární obchod kazí státu bilanci).
Problematika elektronických zdrojů je průběžně řešena v materiálu Příloha 6 Analytický popis elektronických zdrojů [46] a bude se ještě vyvíjet (zápis pole 856, zejména specifikace zápisu v podpolích 856$y a 856$z).
Zdrojové dokumenty - seriály popisujeme dle pravidel pro seriály, zdrojové dokumenty - monografie, popisujeme dle pravidel pro monografie.
Popis monografických/monotematických čísel seriálů je řešen v zásadě dvěma způsoby a v závislosti na tom, jak jsou tyto dokumenty popisovány ve zdrojových bázích.
Jeden záznam vytváříme v případě, že název seriálu je názvem edice (všechna čísla mají své vlastní názvy) nebo druhý způsob v podobě dvou záznamů, jeden pro monografii, druhý pro seriál. Při dostatečně podrobně nadefinovaných polích 9XX pro selekční údaje zdrojových dokumentů se dá použít i jeden záznam.
Zatím navržená pole 9XX [47] umožňují zapisovat selekční údaje týkající se především zdrojového a recenzovaného dokumentu (zápis dalších autorů, variantních názvů, selekčních údajů pro edice). Tato pole se uplatňují v popisu zejména odborných titulů, v monografických číslech seriálů a při popisu zdrojových dokumentů sborníkového typu. V současné době se pokoušíme tato pole strukturovat tak, aby byla v budoucnu propojitelná na autority. Pole jsou ve vývoji.
Stav zápisu monografických/monotematických čísel seriálů, suplementů a polí 9XX v bázi ANL:
- 1090528 [45] (Consequence & Inference; dva výskyty zdroje),
- 781189 [45] (Hegelovské předpoklady otevřené společnosti; dva výskyty zdroje, dřívější zápis - pomocná pole ZAZ, která se již neužívají, tvoří se však dál v konverzi),
- 948810 [45] (Historické argumenty v současných německých diskusích o národních zájmech; jeden výskyt zdroje, opravený zápis pomocí 9XX - edice),
- 999655 [45] (Odborná sympozia. 4. Mortalita a morbidita schizofrenie; číslovaný suplement),
- 1120959 [45] (Problémy studia migrací v českých zemích v raném novověku; suplement),
- 1120718 [45] (Cesty inspirující múzy Klió; zápis edice v 9XX),
- 1109528 [45] (Abstracts of the Immature Beetles Meeting 2007).
Zápis akcí v rámci zdrojových dokumentů je řešen v materiálu dostupném na adrese http://www.nkp.cz/pages/page.php3?page=oazp_metodika21_akce.htm [48].
Materiál vychází z doporučení pro zápis akcí pro monografie a seriály. Příklady zápisu akcí zdrojového dokumentu v bázi ANL:
- 999647 [45] (Odborná sympozia. 1. Psychoterapie a farmakologie; obecný tvar akce jako autor seriálu ve zdrojovém dokumentu),
- 1126770 [45] ("Kde my se máme podít, když nemáme naši zem?"; popis monotematického/monografické čísla seriálu, které vyšlo jako suplement k seriálu, v ANL popsán dvěma výskyty zdrojového dokumentu, jednou jako seriál, jednou jako monografie s kvalifikovanou akcí jako autorem, lze také popsat jedním záznamem s variantním názvem).
Z hlediska analytického popisu by bylo dobré případně zvážit zapisovat všechny autory-akce zdrojových dokumentů pod konkrétní podobou. Pod obecnými tvary akce by měly být dokumenty v bázích zdrojových seriálových dokumentů a autoritách s příslušnými odkazy.
Mutace a nesamostatné přílohy jsou dosud zapisovány v ANL vetšinou jako druhý výskyt zdrojového dokumentu. V budoucnu je třeba názvy mutací sjednotit s názvy mutací v NKC, resp. Souborném katalogu. Problémem však je, že zápis mutací v NKC nevyhovuje Soubornému katalogu. Návrhy zápisu mutací u celostátních deníků budou aktualizovány a zveřejňovány na adrese http://full.nkp.cz/nkdb/docs/tituly_napoveda.htm [34] v bodě 3. Evidence excerpční titulové základny:
- 1130408 [45] (Nestřílel, přesto zachránil mnoho lidí; dosavadní zápis regionální mutace),
- 953037 [45] (Jak je důležité ctíti Oscara; dosavadní zápis přílohy, v budoucnu možno řešit v polích 9XX).
Zatím se při zpracování mutací raději přidržujeme dosavadního zápisu. V některých knihovnách se objevuje tvar podle báze NKC. Tyto záznamy lze globálně opravit dle dohodnutých pravidel.
Někde ustupujeme od zápisu údajů o odpovědnosti v názvových údajích po lomítku (u recenzovaného dokumentu), v poznámkách a soustředíme se na selekční prvky:
- 1127736 [45] (Býti tak kocourem, ach; recenzovaný dokument s údaji o odpovědnosti po lomítku),
- 830735 [45] (Alogismy, prozření a jinakosti Lva Tolstého; recenzovaný dokument bez údajů o odpovědnosti po lomítku).
U autorských údajů odborných článků je naopak žádoucí uvádět organizaci, popř. kontakt na autora:
- 1110821 [45] (Cooperation tendencies and alternative milk marketing channels of dairy producers in Turkey: A case of Meneme),
- 1131239 [45] (Adsorption of zinc contained in the poultry feedstuff onto clinoptilolite).
Ve jmenném i věcném popisu se paravděpodobně budou někde uplatňovat u osob a korporací role, a to v jejich slovní podobě (MARC podpole 100$e, 600$e a 110$e, 610$e). Zatím se tyto role v analytickém popisu nepoužívají:
- 877842 [45] (Adriana Lecouvreur v Národním divadle),
- 1027757 [45] (Dvojí estetika zpěvu) ,
- 759019 [45] (Kdo se stane letošním laureátem pardubického festivalu smíchu?),
- 902315 [45] (Giuseppe Tartini).
Rovněž tak ediční údaje zdrojového dokumentu v popisných údajích by se mohly nahradit pouze selekčními:
- 948810 [45] (Historické argumenty v současných německých diskusích o národních zájmech; zde ještě popisné i selekční údaje o edici).
Vývoj pravděpodobně nastane ještě v podpoli 773$9, kde uvádíme formalizované chronologické označení/datum vydání zdrojového dokumentu.
Ve věcném popisu většina kooperujících institucí aplikuje Konspekt, analytické předmětové kategorie jsou užívány navíc např. v NK ČR, v Olomouci. V budoucnu mohou být využity k výzkumným účelům (ontologie). V NK ČR a v některých záznamech kooperujících institucí (např. MZK, ÚZPI) jsou aplikovány anglické ekvivalenty k předmětovým heslům a užívají se oborové hesáře (STK, ÚZPI, NPKK), někde anotace, v současné době začínáme testovat skenování anotací.
V polovině června proběhlo jednání Pracovní skupiny pro věcné zpracování, které se týkalo zejména uvádění chronologických údajů v záznamu (pole MARC 648 a UNIMARC 965 pro chronologický údaj, dále pak pole pro časový kód MARC 045 a UNIMARC 661 ve vazbě na pole 6XX). Materiály z této skupiny budou zveřejněny. Do jaké míry budou tato pole aplikována v analytickém popisu bude rozhodnuto a schváleno v rámci kooperačního systému.
V analytickém popisu je možno pole 045 najít v některých (spíše dřívějších) olomouckých záznamech , např.:
- 616551 (Koliby a salaše frenštátských měšťanů na počátku 18. století).
Pro současnou analytickou praxi by však měly platit následující zásady: chronologický údaj zapisovat vždy v řetězcích předmětových hesel, kdy je uveden v članku, dále pak chronologicky určit obecná, shrnující hesla ke konkrétním údajům, tj. heslům v záznamu již uvedeným (kde je to vhodné), např.:
- 1133026 [45] (Wölfliho universum),
- 1075117 [45] (Moravské muzeum pod správou Městského národního výboru v Brně),
- 1046284 [45] (Patří Charta do muzea? : mezinárodní vědecká konference k 30. výročí Charty 77. Praha, 21.-23. března 2007 ),
- 1133293 [45] (Můj slezský český úděl),
- 1127051 [45] (Olomouc Husův sbor),
- 1115275 [45] (Kvadratura kruhu : Jiří z Poděbrad, kompaktáta a papežství),
- 1109720 [45]([Paměti krále Slunce]),
- 1112879 [45] (První český bestseler : Kosmova Kronika česká (asi 1119-1125)),
- 1089892 [45] (O hudbě anglicky - The violine).
Pokud některé knihovny zatím nepoužívají předmětové řetězce, je možno chronologický termín zapisovat v klíčových slovech.
Pro ukázku uveďme další příklady z báze ANL:
- 1130433 [45] (Nejstarší soupisy rukopisů knihovny benediktinského opatství Rajhrad z pera A. Habricha a jejich srovnání s dnešním stavem),
- 1129679 [45] (Reakce na text S. Sousedíka v TT3/2005; polemika s článkem),
- 1120720 [45] (Pseudomyiasis with connection to organic waste),
- 1122960 [45] (Poznámky k fragmentům barevného pojednání nejstaršího interiéru kostela sv. Mořice v Olomouci),
- 1104229 [45] (Očekávaný stav a provoz ES ČR v perspektivě z pohledu soběstačnosti ČR),
- 1105662 [45] (Studium sociální práce na teologické fakultě),
- 1132540 [45] (Barokní černá kronika),
- 1105012 [45] (Královna Alžběta),
- 1123575 [45] (Classification of 4-dimensional homogenous D´Atri spaces),
- 1111417 [45] (Elektronická podpora výuky chemie na základní škole),
- 1112713 [45] (Chrudimské proporce),
- 1131180 [45] (Euro: the engine of integration or the seed of dissolution?),
- 1128007 [45] (On distribution of slope deformations In the north-eastern part ot the Vizovická vrchovina Highland in Eastern Moravia; naskenovaná anotace),
- 1118035 [45] (Životní jubileum Ivana Wilhema),
- 1132578 [45] ([Echo Objects: the Cognitive Work of Images]),
- 1077396 [45] (Kuník z Weitmile "Plebanus in Lipa" a jeho rod = Kuník of Weitmile "plebanus in Lipa" and his clan),
- 1110752 [45] (Válečný pomník v Chřibské),
- 1125900 [45] (Než zvoničky dozvoní),
- 1120802 [45] (Analyses of historical development, soil moisture regime and scattered vegetation in the landscape area of UAE Žabčice),
- 1120079 [45] (Apoptosis and Aging in Mitochondrial Morphology Mutants of S. cerevisiae),
- 1100129 [45] (Contribution to the new reading about the Constantine Porphyrogenitus' statement on the numbers of croat horsemen, foot soldiers and sailors in early 10th century),
- 1114655 [45] (Anatomy of a confrontation : a review of recent publications on modern Xinjiang),
- 1108013 [45] (Evropská unie a členské státy před Evropským soudem pro lidská práva (ve světle případu Bosphorus).
Koncem r. 2006 byla provedena analýza týkající se vývoje věcného popisu a zveřejněn materiál Vývoj věcného popisu v ANL a současné tendence [49].Významné jsou aktivity ALA v rámci FAST [50] (Faced Analysis of Subject Terminology).
V analytických záznamech je patrný náznak věcných ontologií (Konspekt a analytické předmětové kategorie v návaznosti na předmětová hesla).
V projektech řešených v letech 1999-2004 bylo navrženo vyhledávání podle tří úrovní topiků, strukturovaných dotazů postihující pojmy či témata, ukázka vyhledání podle topiku je v materiálu Stahování, export metadat (údaje o článku a plné texty) - ukázka výstupu [51].
Věcný popis je v metodice řešen v rámci materiálu 4.4 Pole 6XX [52].
Vývoj bude v ANL v poli 630, které se užívá někdy pro recenzované dílo, pro názvy různých typů a/nebo druhů dokumentů, inscenací, které se zatím uvádějí někde v kulaté závorce. Nabízí se úvaha o jejich přesunu do pole pro druh dokumentu tam, kde nejsou takto pojednány v autoritách:
- 981741 [45] (Svobodu pro všechny chlapy!),
- 953037 [45] (Jak je důležité ctíti Oscara),
- 920598 [45] (Složitost hledání).
Protože záznamy ANL většinou splňují podmínky minimálního záznamu, byly záznamy odlišeny na základě kvality věcného popisu. Pole VAH obsahuje tyto hodnoty:
- VAH 12 - pouze minimální záznam,
- VAH 14 - klíčová slova, předmětová hesla ne podle národních autorit ani jiných odborných heslářů,
- VAH 16 - klíčová slova, předmětová hesla částečně podle národních autorit,
- VAH 18 - klíčová slova, předmětová hesla podle národních autorit, event. anglické ekvivalenty, event. oborové hesláře, event. resumé/anotace česky, anglicky,
- VAH 20 - jako VAH 18 plus předmětová hesla podle oborových heslářů a jejich ekvivalenty.
Na závěr této kapitoly pouze stručná zmínka o citacích; o identifikátorech a propojování záznamů viz bod 3.5.
V současné době je velmi aktuální problematika citací (variabilita citací a způsobu citování, unifikace formátu pro citace, extrakce a reformátování citací, propojení archivů na základě citací, sledování citovaných a citujících autorů, návazné sociometrické a biometrické analýzy pro odhalování tendencí ve vývoji vědy). Existují různé citační styly. Způsoby citování dle ISO 690 jsou popsány v materiálu [6].
Některé, zde uvedené příklady, jsou v současné době řešené jako klíčové a budou pravidelně aktualizovány, aby se zpřehlednila informace o současném stavu metodiky. Pokud se v bázi ANL změní sysna záznamů, je možno najít příklady podle názvů. Souhrnná informace o všech aktualizacích metodiky pro UNIMARC i MARC 21 pro analytický popis bude od července 2008 na jednom místě - na adrese http://www.nkp.cz/pages/page.php3?page=oazp_metodika21isbd.htm [53], a to s odkazy na konkrétní změny od tohoto data. Na tomto místě budou také soustředěné odkazy na některé, výše uvedené řešené klíčové příklady, eventuálně příklady další.
K metodice popisu na závěr: je žádoucí kromě materiálů týkajících se analytického popisu sledovat materiály týkající se katalogizační politiky dostupné na adrese http://www.nkp.cz/pages/page.php3?page=fond_standard1.htm [54], dále pak informace týkající se autorit na adrese http://autority.nkp.cz/ [55] a databázi AUT [56]. Stručná informace pro kooperační systém, která vychází z těchto materiálů, je na adrese http://www.nkp.cz/pages/page.php3?page=oazp_metodika21aut.htm [57].
Než vyjdou pravidla pro analytický popis tiskem, je dobré pro orientaci nahlížet do tištěných materiálů vydávaných pro jiné druhy dokumentů.
3. Koncepce rozvoje Kooperačního systému článkové bibliografie [3, snímky 171-200]
3.1 Titulová základna kooperace a spolupráce při zpracování titulů
V kooperačním systému participují instituce, které excerpují některé tituly jen pro vlastní potřebu nebo které nepřispívají do ANL, tj. spolupracují pouze na základě dohody o titulech. Tyto tituly je třeba podchytit.
Spolupráci je třeba zaměřit na vysoké školy, AV ČR, zapojit muzea, archivy, městské knihovny a jiné instituce. Mnohé z těchto institucí zpracovávají články, většinou výběrově. Knihovny, vysoké školy, akademické instituce a jiné specializované instituce by měly svou produkci a specializaci zpracovávat v úplnosti samy a/nebo v rámci sdílené katalogizace. NK ČR by se měla soustředit na ty obory, které jsou pro ni prioritou, a na průniková témata.
Žádoucí je přebírání metadat vytvořených autory, vydavateli, nakladateli, distributory a jinými producenty článkových informací do analytických záznamů, včetně anotací a klíčových slov, autoarchivace samotnými autory a budování otevřených archivů.
3.2 Software, popis
Problémy dané různým softwarem se minimalizovaly. V současné době je třeba ještě vyladit několik detailů v konverzích, popř. do nich zabudovat změny, které vyplynou z řešení problematiky popisu v budoucnu. Určitou možnost sblížení formátů MARC 21 a UNIMARC je možné vysledovat v analytickém popisu přes pole 9XX a standardní pole UNIMARCu 4XX.
U zdrojových dokumentů je třeba dodržovat důsledně dělení na monografie, seriály a na monografická čísla seriálů aplikovat potřebná pravidla popisu. Popis se bude ještě vyvíjet u monografických čísel seriálů. Rovněž tak definice polí 9XX bude zpřesněna. U mutací celostátních a regionálních deníků se jeví zatím schůdná varianta (s ohledem na Souborný katalog) uvádět název mutace v podpoli pro název části. Analytický materiál k tomuto problému bude zveřejněn.
U unifikovaných názvů se jeví jako užitečné využít u analytického popisu pole pro druh a/nebo formu dokumentu, podmínkou je vyjasnění termínů definicí i taxativně.
V rámci analytického popisu se bude rozvíjet metodika popisu elektronických zdrojů „pravých“ i „nepravých“ a dalších druhů a typů dokumentů v souvislosti s budováním otevřených archivů. Do zpracování třeba v budoucnu zahrnout šedou literaturu (sborníky z konferencí, preprinty apod.), která je těžko dostupná a vyhledatelná.
Vývoj systému ovlivní též publikační činnost vysokých škol, akademických aj. institucí. Je třeba uvažovat o zařazení i zahraničních bohemik a zvážit import článků z různých referenčních zdrojů do báze ANL.
Věcný popis posune dopředu aplikace oborových a jiných specializovaných heslářů, výzkum je hypoteticky možný v oblasti věcných ontologií, a to v návaznosti systematických analytických předmětových kategorií na předmětové kategorie Konspektu, skupiny Konspektu, oborové hesláře a předmětová hesla.
Celkově je třeba popis někde zpřehlednit a zpřesnit, soustředit se na autority a selekční prvky, vystihnou souvislosti a vazby k jiným údajům. Je třeba zajistit konzistentní přidělování identifikačních čísel importovaných článků v rámci báze ANL, opravy rejstříků a pozůstatků dřívějších metodik a systémů (např. způsob zápisu členů apod.), sledovat vývoj problematiky popisu v rámci RDA, konečně zpřehlednit metodiku popisu článků v MARCu 21 a zrevidovat metodiku popisu článků v UNIMARCu.
3.3 Možné subsystémy v rámci KOSABI z hlediska forem titulů a metod zpracování
Z hlediska druhů a typů zpracovávaných dokumentů a způsobu získávání je možno v rámci systému vytipovat několik subsystémů, které se mohou prolínat, některé z nich pravděpodobně teprve vzniknou:
- Zpracování tištěných dokumentů v tradičních systémech,
- Zpracování dokumentů exitujících paralelně v tištěné a elektronické formě v rámci spolupráce s jinými institucemi, nakladateli/vydavateli, producenty a distributory plných textů, linky zpracování,
- Zpracování elektronických textů exitujících jen v elektronické formě, koordinace analytického zpracování online elektronických zdrojů, eventuálně vybraných offline elektronických zdrojů – dále spolupráce jako v bodě II.,
- Zpracování plných textů volně přístupných na www na základě automatického sběru dat (pouze vytipované spolehlivé seriálové zdroje, za spolupráce s Webarchivem),
- Budování otevřeného archivu plných textů, zejména odborných
- VII. Digitalizace sešitů a kartoték s článkovou bibliografií,
- VIII. Aplikace protokolu OAI-PMH pro sklízení dat v rámci kooperačního systému a import dat z dalších referenčních databází,
- IX. Analytické zpracování dalších druhů dokumentů.
Systém by měl navazovat na již existující a nově vznikající databáze, katalogy, sítě, další zdroje, digitální knihovny a úložiště dat v ČR a ve světě.
3.4 Tendence získávání, zpracování, vyhledávání, zpřístupňování, uchovávání informací (nejen) o článcích
Při získávání informací o článcích je třeba spolupracovat s autory, nakladateli, vydavateli a distributory článkových informací - viz též bod 3.1. Při zpracování informací půjde o kombinaci manuálního ukládání s metodami extrakce údajů. Vyhledávání by mělo být jednoduché a zároveň sofistikované a intuitivní. Vedle tradičních systémů se uplatňují zvláště při zpřístupňování odborných informací otevřené archivy různého typu. Digitální knihovny by měly mít spolehlivá úložiště dat. Předpokladem dobrých služeb je vypracování obecně platných modelů řešení problematiky autorských práv, které lze aplikovat na konkrétní podmínky. Do českého právní řádu má být zabudováno řešení podle Creative Commons [58].
3.5 Některé konkrétní metody a trendy
Informace jsou zpřístupňovány pomocí metadat a formátů pro jejich zpřístupnění a uchovávání - XML, DC METS kontejner, MODS aj.
V rámci sémantického webu mají informace přesně definovaný význam pomocí různých nástrojů jako je RDF, XML a identifikátorů URI, ontologií. Informace je třeba vidět v souvislostech. K propojování informací by měla přispět aplikace konceptu FRBR, SFX a OpenURL.
Záznam by měl jednoduše postihovat vhodnou kombinaci údajů k propojení na údaje a záznamy související.
Články, texty a jiné elektronické objekty je třeba jednoznačně identifikovat. Mezi nejpoužívanější identifikátory patří DOI, SICI, NBN. Stanovení vhodného identifikátoru je důležité pro digitální knihovny.
Zdá se, že dokumenty s otevřeným přístupem mají někdy větší návštěvnost než dokumenty komerční. Klasické publikování v odborných časopisech je často zdlouhavé. Citace a jejich forma hrají důležitou roli při propojování archivů. Uživatel je spolutvůrcem informací.
3.6 Kontinuita
Kooperace v rámci systému je léty prověřená, díky uploadu záznamů je báze ANL pravidelně plněna, záznamy kooperujících institucí jsou zpřístupňovány v JIB, kooperující instituce mají své vlastní databáze. ANL jako multioborová databáze, může mít hodně „odnoží“. Záznamy jsou dostatečně podrobné s variabilitou údajů v nich a možnost návazností na související databáze. Je třeba zprovoznit aplikaci pro online evidenci excerpční základny.
Linka pro extrakci metadat z plných textů s možností další editace umožňuje generovat metadata ve formátech DC, UNIMARC, XHTML, RDF/XML, MARC 21, RSS. Automaticky jsou generovány identifikátory URL, NBN, SICI. Záznamy z linky jsou zpřístupněny v databázích ANL i ANL FULL. Pokud by byla oživena, je ji třeba zasadit do nového prostředí. DC je třeba doplnit o data administrativní a technická.
Báze ANL FULL je zpřístupňována v sofistikovaném vyhledávacím systému, kombinace vyhledávání ve strukturovaných datech a plných textech se pokládá za optimální metodu. Portál Periodika na WWW může sloužit jako jeden z pramenů možných zdrojů určených k archivaci. Kooperační systém by měl v budoucnu navázat na nové poznatky projektů VaV a VISK.
V letech 2006/2007 proběhlo jednání s Unií vydavatelů o možnostech zpřístupnění báze ANL FULL. V budoucnu bude nutno uzavřít licenční, resp. podlicenční smlouvu týkající se báze ANL FULL tak, aby ji bylo možné zpřístupňovat externím uživatelům.
3.7 Koncepce rozvoje kooperačního systému v širším kontextu vychází (podobně jako Souborný katalog) z následujících materiálů a programů:
- Koncepce rozvoje knihoven v ČR na léta 2004-2010,
- i2010: Digitální knihovny (Project DigitalPreservationEurope),
- Koncepce české a národní digitální knihovny, úložiště dat,
- Knihovní zákon,
- Zákon o neperiodických publikacích,
- Tiskový zákon,
- Autorský zákon,
- Creative Commons po zabudování do českého právního rámce,
- Doporučení EU, resp. Evropské komise, týkající se autorského práva [59].
3.8 Hlavní úkoly Kooperačního systému článkové bibliografie v budoucnosti
Pokračovat a rozšiřovat spolupráci v rámci systému, navázat spolupráci s nakladateli, vydavateli, distributory eventuelně autory, podporovat návaznost na Souborný katalog, SKAT a jiné databáze a systémy, Národní digitální knihovnu a úložiště dat (WebArchiv, Kramerius aj.), Google Scholar. Nutné jsou opravy báze ANL.
Kooperační systém článkové bibliografie svými návaznostmi na další instituce, projekty, sítě knihoven zasahuje do všech vrstev Národní, resp. České digitální knihovny a její struktury. Souvisí s budoucím vývojem lokálních, resp. institucionálních repozitářů.
Titulová (excerpční) základna systému, která je dělena zatím do čtyř kategorií, a spolupráce z ní vyplývající po linii regionální a oborové, může být klíčem k začlenění systému do Národní digitální knihovny.
Je třeba též navázat na nové formy a způsoby zpřístupňování bibliografických informací prostřednictvím protokolu OAI-PMH, na iniciativy spojené s otevřenými archivy (OAI [60]) a projektem The European Library [61].
Situace kolem zpřístupňování českých plných textů nebyla a zdaleka není transparentní. Řešení projektů týkajících se zpřístupnění plných textů provázela moje neustálá obava, aby se neporušovala autorská práva a často nebylo příjemné. Tím spíše, že v případě Anopress jde o texty komerční.
O přístup k plným textům báze Anopress přes bázi ANL mají zájem i členové konzorcia Anopress. Kromě ošetření přístupu uživatelů na plné texty Anopress z báze ANL je potřeba uzavřít nové nebo aktualizovat stávající smlouvy. Externí uživatelé mají též zájem o texty báze ANL FULL. V tomto směru proběhnou patrně v blízké době jednání.
Je vidět, že v kooperačním systému článků bylo uděláno hodně práce a činnost je poměrně různorodá. V oddělení analytického zpracování NK ČR jsme v současnosti celkem vytíženi. Někteří pracovníci z kooperačního systému vykonávají často i jiné činnosti než zpracování článků.
Ráda bych poděkovala všem kolegyním a kolegům za dosavadní spolupráci.
- ANDĚROVÁ, Ivana. Kooperační sytém článkové bibliografie a propojení analytických záznamů s plnými texty - východiska a současný stav. Národní knihovna : knihovnická revue. 2001, roč. 12, č. 1, s. 26-37. ISSN 0862-7487. Dostupný též na World Wide Web: <http://full.nkp.cz/nkkr/NKKR0101/0101026.html [62]>. ISSN 1214-0678.
- ANDĚROVÁ, Ivana. Kooperační systém článkové bibliografie - KOSABI. (Vývoj a současný stav metodiky zpracování, zpřístupnění, organizace kooperace, perspektivy). In Knihovny současnosti 2002 : sborník z 10. konference, konané ve dnech 24.-26.září 2002 v Seči u Chrudimi. 2002, s. 223-255. ISBN 80-86249-15-8. Dostupný též na World Wide Web: <http://full.nkp.cz [63]>. Rubrika Dokumenty.
- ANDĚROVÁ, Ivana. Kooperační systém článkové bibliografie KOSABI [online]. 17. 12. 2007, květen 2008 [cit. 2008-06-12]. Skupina ANL, seminář, Praha, NK ČR. Dostupný na World Wide Web: <http://full.nkp.cz/nkdb/docs/ANL_07.ppt [4]>.
- ANDREJČÍKOVÁ, Naděžda. Dotknu se nás ontológie? In Elektronické služby v znalostnej společnosti [online]. Zvolen : Technická univerzita vo Zvolene, 2007 [cit. 2008-06-12]. Dostupný na World Wide Web: <http://sldk.tuzvo.sk/cosmo/foto/seminar/zbornik/obsah.html [64]>. ISBN 978-80-228- 1778-3.
- BRATKOVÁ, Eva. Otevřený přístup, digitální knihovny a citační služby. In Inforum 2006 – 12. konference o profesionálních informačních zdrojích, Praha 23. – 25.5.2006 [online]. Praha : AiP, 2006 [cit. 2008-06-12]. Dostupný na World Wide Web: <http://www.inforum.cz/inforum2006/pdf/Bratkova_Eva.pdf [65]>.
- BRATKOVÁ, Eva. Metody citování literatury a strukturování bibliografických záznamů podle mezinárodních norem ISO 690 a ISO 690-2 : metodický materiál pro autory vysokoškolských kvalifikačních prací [online]. Verze 1.0. Praha : Odborná komise pro otázky elektronického zpřístupňování vysokoškolských kvalifikačních prací, Asociace knihoven vysokých škol ČR, 2008-04-13 [cit. 2008-06-08]. Dostupný na World Wide Web: <http://www.evskp.cz/SD/4c.pdf [66]>.
- BRATKOVÁ, Eva. Nový online přístup k databázi SIGLE (projekt OpenSIGLE). Ikaros [online]. 2007, roč. 11, č. 10 [cit. 2008-06-18]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/4346 [67]>. URN-NBN:cz-ik4346. ISSN 1212-5075.
- CELBOVÁ, Ludmila. Archivace elektronických zdrojů v ČR a jejich registrace v české národní bibliografi i (Srovnání s výsledky přehledu IFLA). Knihovna [online]. 2005, roč. 16, č. 2, s. 67-70 [cit. 2008-06-18]. Dostupný z WWW: <http://knihovna.nkp.cz/knihovna52/celbova.htm [68]>. ISSN 1801-5948.
- DROBÍKOVÁ, Barbora. Vývoj, směřování a trendy katalogizace za poslední čtyři roky: od FRBR až po revizi AACR2R v roce 2002. Národní knihovna : knihovnická revue. 2002, roč. 3, č. 3, s. 153-167. ISSN 0862-7487. Dostupný též na World Wide Web: <http://full.nkp.cz/nkkr/Nkkr0203/0203153.html [69]>. ISSN 1214-0678.
- EHRLICHOVÁ, Klára. Archivy, knihovny, muzea v digitálním světě 2007. Ikaros [online]. 2008, roč. 12, č. 1 [cit. 2008-06-12]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/4501 [70]>. URN-NBN:cz-ik4501. ISSN 1212-5075.
- Ikaros, redakce. WORKSHOP A: Vyhledávání citací: Google a další zdroje (Péter Jacsó). Ikaros [online]. 2007, roč. 11, č. 5/2 [cit. 2008-06-18]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/4099 [71]>. URN-NBN:cz-ik4099. ISSN 1212-5075.
- LICHTENBERGOVÁ, Edita. Konference Cataloguing 2007: Back to Basics – and Flying into the Future. Ikaros [online]. 2007, roč. 11, č. 3 [cit. 2008-06-12]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/3956 [72]>. URN-NBN:cz-ik3956. ISSN 1212-5075.
- Joint Steering Committee for Development of RDA. RDA: Resource Description and Access [online]. Last updated: 8 May 2008 [cit. 2008-06-12]. Dostupný na World Wide Web: <http://www.collectionscanada.gc.ca/jsc/rda.html [73]>.
- PLANKOVÁ, Jindra. Terminologické záležitosti Open Access. Ikaros [online]. 2007, roč. 11, č. 11 [cit. 2008-06-12]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/4400 [74]>. URN-NBN:cz-ik4400. ISSN 1212-5075.
- PLANKOVÁ, Jindra. Klíčové iniciativy Open Access – „3B“. Ikaros [online]. 2007, roč. 11, č. 12 [cit. 2008-06-13]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/4442 [75]>. URN-NBN:cz-ik4442. ISSN 1212-5075.
- PLANKOVÁ, Jindra. Zdroje informací s otevřeným přístupem. Ikaros [online]. 2008, roč. 12, č. 3 [cit. 2008-06-12]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/4609 [76]>. URN-NBN:cz-ik4609. ISSN 1212-5075.
- PLANKOVÁ, Jindra. Technická řešení pro otevřený přístup. Ikaros [online]. 2008, roč. 12, č. 2 [cit. 2008-06-18]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/4555 [77]>. URN-NBN:cz-ik4555. ISSN 1212-5075.
- STOKLASOVÁ, Bohdana. Perspektivy důvěryhodného digitálního úložiště v rámci Národní digitální knihovny. Knihovna [online]. 2006, roč. 17, č. 2, s. 49-55 [cit. 2008-06-08]. Dostupný z World Wide Web: <http://knihovna.nkp.cz/knihovna62/stoklas.htm [78]>. ISSN 1801-5948.
- SVOBODOVÁ, Eva; VYORÁLKOVÁ, Dana. Vývoj, současný stav a koncepce dalšího rozvoje Souborného katalogu ČR. Knihovna [online]. 2007, roč. 18, č. 1, s. 55-76 [cit. 2008-06-18]. Dostupný z World Wide Web: <http://knihovna.nkp.cz/knihovna61/svobod.htm [79]>. ISSN 1801-5948.
- TKAČÍKOVÁ, Daniela; RAMAJZLOVÁ, Barbora (ed.). Automatizace knihovnických procesů – 11 : sborník z 11. ročníku semináře pořádaného ve dnech 16.–17. května 2007 v Liberci. Praha : ČVUT, 2007. 136 s. ISBN 978-80-01-03691-4. Dostupný též z WWW: <http://www.akvs.cz/akp-2007/sbornik.html [80]> .