Zpráva ze Semináře ke zpřístupňování šedé literatury 2008
Na seminář Systémy pro zpřístupňování eVŠKP 2008 druhý den volně navázal Seminář ke zpřístupňování šedé literatury 2008 [4], pořádaný Státní technickou knihovnou [5] (STK) a Vysokou školou ekonomickou v Praze (VŠE) [6]. Sborník ze semináře je společně s výsledky evaluace zpřístupněn na webovém sídle Národního úložiště šedé literatury [7]. Účastníky přivítala a akci moderovala PhDr. Radka Římanová z STK.
Projekt NUŠL a další projekty v ČR
V prvním příspěvku informovala PhDr. Petra Pejšová (STK) o aktuálním stavu výzkumného záměru Digitální knihovna pro šedou literaturu – funkční model a pilotní realizace. Projekt se nyní nachází v první etapě – přípravě zadávací dokumentace pro modelovou aplikaci. Tato etapa potrvá do června 2009. Projekt má být zakončen v prosinci 2011 těmito výstupy: Funkční modelová aplikace a návazné služby a odborná publikace a WWW stránky (popisující doporučený metadatový formát, výměnné formáty, vzory licenčních modelů, metodiku ochrany, archivace a zpřístupňování digitálních dat). Realizační tým spolupracuje s obdobnými či souvisejícími aktivitami v ČR (Národní digitální knihovna [8], Webarchiv [9], Národní registr eVŠKP [10]) i zahraničí (OpenSIGLE [11], DRIVER [12]). V roce 2008 bylo realizováno dotazníkové šetření, jehož cílem bylo zmapovat poptávku po systému pro uchování šedé literatury a navázat kontakty. Osloveno bylo 77 institucí – vysokých škol a výzkumných ústavů Akademie věd, odpovědělo 47 institucí (61%). Z výsledků vyplývá, že 37 institucí považuje přístup z jednoho místa k dokumentům šedé literatury za výhodný a 39 institucí je ochotno spolupracovat. Výsledky dotazníku jsou zpřístupněny na webovém sídle NUŠL [13]. Přednášející dále nastínila východiska metadatového formátu NUŠL, jeho základní požadavky a výchozí formáty.
Prezentace ke stažení: http://nusl.stk.cz/images/Projekt_NUSL.pdf [14]
Grey Literature ve světě
Na příspěvek dr. Pejšové navázala PhDr. Martina Pfeiferová (také STK) se shrnutím aktuálního dění v oblasti šedé literatury v Evropě i ve světě. Nejprve představila definici šedé literatury a koncepci jejího zpřístupnění, na které pracuje Grey Literature Network Service (GreyNet). Přednášející dále v příspěvku upozornila na zajímavé projekty, přičemž vycházela z referátů, přednesených na konferenci GL9 konané v prosinci 2007 v Belgii:
- holandský program DARE umožňující přístup k výsledkům výzkumu v digitální podobě všech výzkumných institucí pomocí sítě DAREnet [15];
- portál a informační brána NARCIS [16], informující na jednom místě o programech, projektech a institucích v Holandsku integrující i obsah sítě DAREnet;
- holandský elektronický archivní systém EASY [17], představující rozhraní s otevřeným přístupem pro výsledky výzkumu z oblasti humanitních, společenských věd a umění;
- německý portál společenských věd SOWIPORT [18];
- italský systém repozitářů PUMA [19];
- japonská informační brána ScienceLinks Japan [20];
- metarepozitář OpenDOAR [21] zahrnující ověřené repozitáře s otevřeným přístupem;
- registr repozitářů s otevřeným přístupem ROAR [22];
- adresář časopisů s otevřeným přístupem DOAJ [23];
- neziskové sdružení výzkumných organizací euroCRIS [24];
- evropská síť repozitářů DRIVER [25].
Dr. Pfeiferová sdělila, že na příští konferenci o šedé literatuře GL10 konané v prosinci 2008 společně s kolegyní dr. Pejšovou vystoupí s příspěvkem shrnujícím aktivity v oblasti šedé literatury v ČR.
Prezentace ke stažení: http://nusl.stk.cz/images/GL01.pdf [26]
Plný text přednášky ke stažení: http://nusl.stk.cz/images/GL_ve_svete.pdf [27]
PDF a ISO standardy pro dlouhodobé archivování
RNDr. Vladimír Střálka z českého zastoupení společnosti Adobe [28] v zajímavé a účastníky oceněné prezentaci seznámil s aktuálním děním v oblasti standardizace formátu PDF, srovnal jeho jednotlivé verze a upozornil na specifika verze PDF/A, která je určena pro dlouhodobou archivaci dokumentů. Společnost Adobe se věnuje jak standardizaci různých verzí formátu PDF, tak vývoji nástrojů pro vytváření, úpravu a prohlížení PDF dokumentů. Dokument PDF je standardizován v těchto verzích:
Označení | Standard | Využití (určení) | Vazby |
---|---|---|---|
PDF/A | ISO 19005 | dlouhodobá archivace | založeno na PDF 1.4 |
PDF/X | ISO 15930 | grafická dokumentace a tiskové publikování | založeno na PDF 1.4 a 1.6 |
PDF/E | ISO 24517 | technická a výkresová dokumentace pro inženýrské potřeby v různých oblastech (stavebnictví, průmysl, geoaplikace) | založeno na PDF 1.6 |
PDF/UA | AIIM [29] | univerzální dostupnost např. pro zrakově postižené | ISO |
PDF 1.7 | ISO 32000 | elektronický spis (složka dokumentů) |
PDF/A [30] je určen pro nasazení v aplikacích a projektech realizujících dlouhodobé uchovávání. Představuje mechanismus pro reprezentaci elektronického dokumentu pomocí jeho vizualizace, která je vytvořena nezávisle na čase. Standardizován je v několika úrovních (PDF/A-1a, PDF/A-1b, PDF/A-2) lišících se způsobem extrakce textu. PDF/A není jen otázkou samotného formátu, samo o sobě nevytváří archivní řešení – to je realizováno nasazením komplexního archivního workflow. PDF/A je rozšířen v mnohých archivech a státních organizacích po celém světě, např. je předepsán v Národním archivu Nizozemska, v Kongresové knihovně ve Washingtonu, na Ministerstvu obrany Francie či na Ministerstvu vnitra SRN. De facto je standardem v Národním archivu Norska či na Ministerstvu financí Francie, je akceptován Evropskou komisí.
Prezentace ke stažení: http://nusl.stk.cz/images/STK_Brno2008h.pdf [31]
Standardizace otevřených archivů: popis a výměna agregovaných webových zdrojů prostřednictvím OAI-ORE
Po přestávce představil Mgr. Petr Novák (Ústav výpočetní techniky a Ústav informačních studií a knihovnictví FF UK v Praze) novou aktivitu Iniciativy pro otevřené archivy [32] (Open Archive Initiative – OAI), která je odborné veřejnosti známa jako původce protokolu OAI-PMH. Nová aktivita s názvem Znovupoužití a výměna digitálních objektů (Object Reuse and Exchange [33]) si klade za cíl nalézt způsob, jak deklarovat vazby mezi jednotlivými komponentami a prvky, ze kterých se skládají digitální objekty, a jak jednotlivé komponenty a prvky komunikovat prostřednictvím počítačových sítí s cílem zachování maximální informační hodnoty možných existujících a souvisejících vazeb. Nalezený způsob je následně symbolicky vyjádřen prostřednictvím Abstraktního datového modelu (Abstract Data Model). K modelu je nabídnuto několik způsobů, jak prostřednictvím stávajících webových standardů a technologií realizovat celý proces v reálném provozu.
Nová aktivita nenavazuje na předchozí OAI-PMH, ani jej nerozšiřuje či na něj nenavazuje, ale definuje datový model pro mapy zdrojů popisující agregace webových zdrojů a navrhuje formáty pro serializaci těchto map. ORE využívá webové architektury, kdy každý informační objekt je označen pomocí identifikátoru URI. Výměna map zdrojů je umožněna nezávisle buď přímým zpřístupněním na webu (HTTP / HTML zpřístupnění), nebo pomocí dávkových mechanismů. OAI-PMH je jeden z protokolů, který může být využit pro implementaci dávkového zpřístupnění.
Aktivita ORE má umocnit informační hodnotu materiálů skrytých v repozitářích, překonat bariéru a informace z repozitářů nabídnout jinde a učinit z repozitářů aktivní uzly v globálním kontextu internetu.
Přednášející dále prezentoval ukázky map zdrojů a agregací, zmínil také vazby k existujícímu kontejnerovému formátu METS, který je též určen pro výměnu složených digitálních objektů.
Prezentace ke stažení: http://nusl.stk.cz/images/OAI-ORE_prezentace.pdf [34]
Plný text přednášky ke stažení: http://nusl.stk.cz/images/OAI-ORE_text.pdf [35]
Creative Commons a šedá literatura
Bc. Lukáš Gruber z Národní knihovny (NK ČR) informoval o současném dění v oblasti licenčních modelů Creative Commons (CC). Šest let stará koncepce z pera prof. Lawrence Lessiga umožňuje autorům textových, hudebních, vizuálních, audiovizuálních, architektonických děl pomocí deklarace licenčních prvků stanovit práva a povinnosti nabyvatele licence (uživatele díla). Ze základních licenčních prvků (právo na šíření, úpravy díla, uvedení autora atd.) jsou následně sestaveny komplexní licence CC, které dovolují nabyvateli dílo za různých podmínek šířit, vyžadují, aby při šíření díla byly uvedeny údaje o díle (autorství, původní lokace díla). Mezi dalšími požadavky může figurovat připojení odkazu na původní licenci CC. Také platí, že licence jsou neodvolatelné, nevýhradní a zanikají v případě porušení jejich podmínek nabyvatelem.
Přednášející dále informoval o generátoru licencí CC [36], který online vytváří metadata definující autorem požadovanou licenci. Tato metadata lze následně vložit do webové prezentace a vyjádřit tak autorovu vůli licencovat své autorské dílo. Podstatným rysem licencí CC je vazba na autorské právo dané země. Přestože není současný model v rozporu s českým právním řádem (autor upozornil na novelu autorského zákona č. 216/2006 Sb. (§ 46, odst. 5 a 6), je vhodné připravit českou verzi licence CC ve spolupráci s mezinárodní standardizační skupinou Creative Commons International, jež pečuje o vytváření národních lokalizovaných verzí. Na tomto úkolu kooperují členové pracovní skupiny (Iuridicum Remedium [37], Národní knihovna ČR – projekt WebArchiv [38], Právnická fakulta UK [39] a Společnost pro autorské právo a informační technologie [40]). Překlad je nyní ve fázi veřejného připomínkového řízení, více informací je k dispozici na stránkách projektu na adrese http://www.creativecommons.cz/ [41].
Prezentace ke stažení: http://nusl.stk.cz/images/CC_prezentace.pdf [42]
Plný text přednášky ke stažení: http://nusl.stk.cz/images/CC_text.pdf [43]
Stav implementace perzistentních identifikátorů v NK ČR a výhled do budoucnosti
V posledním příspěvku semináře představil Bc. Ladislav Cubr aktuální a budoucí stav implementace perzistentních identifikátorů (PID) v NK ČR. Po obecném úvodu byl oznámen pokrok, jehož bylo dosaženo v roce 2008. Tyto české projekty začaly využívat PID:
- Knihovna Akademie věd využívá DOI;
- Kramerius v NK ČR využívá od března 2008 Handle;
- Ústav výpočetní techniky UK v Praze nasadí Handle do konce roku 2008 v Univerzitním repozitáři na platformě DigiTool.
Národní knihovna ČR vybrala technologii URN:NBN pro účely Národní digitální knihovny a pracuje na implementaci národního resolveru, přičemž využívá zkušeností italského konsorcia tvořeného institucemi Fondazione Rinascimento Digitale (FRD), National Library in Florence (BNCF), University Consortium (CILEA). Výsledkem výzkumu je prototyp aplikace pro správu NBN, založený na systému DSpace. Po otestování prototypu bude následovat implementace, tj. vývoj resolveru a otestování peer-to-peer technologie (decentralizovaný přístup) a rozšíření využívání v Itálii a stanovení vazeb na další systémy PID.
Českou implementaci URN:NBN čekají následující nejbližší úkoly:
- stanovení struktury systému, která bude sestávat z centrálního uzlu (NK ČR – registrátor první úrovně) – lokálních uzlů (registrátoři druhé úrovně);
- stanovení chování resolvování mezi uzly (lokalizace PID);
- doladění syntaxe PID.
Přednášející zdůraznil důležitost dalšího vývoje a zejména zajištění financování pokračování celého projektu. Následně moderující dr. Radka Římanová přednášejícím poděkovala a všechny pozvala na další ročník semináře v roce 2009.
Prezentace ke stažení: http://nusl.stk.cz/images/PID_prezentace.pdf [44]
Plný text přednášky ke stažení: http://nusl.stk.cz/images/PID_text.pdf [45]