Institucionální repozitáře - z červnové přednášky Briana Rosenbluma v STK
Dne 20. června 2006 ve školícím středisku Státní technické knihovny v Praze přednesl dr. Brian Rosenblum z University of Kansas přednášku na téma Institucionální repozitáře. Jméno autora není v českých luzích a hájích neznámé – kromě spolupráce s dr. Miroslavem Bartoškem z brněnské Masarykovy univerzity na výzkumu digitálních knihoven se pochlubil také manželkou původem z jižní Moravy.
Přednáška byla věnována digitálnímu repozitáři KU ScholarWorks provozovanému na University of Kansas ve městě Lawrence a tématům souvisejícím s přípravou a realizací repozitáře. Obsahem repozitáře jsou vědeckovýzkumná díla vytvářená členy akademické obce této univerzity, jde tedy o institucionální repozitář.
Univerzitní knihovna KU (Kansas University) čítá na 4 miliony svazků, univerzitní Muzeum umění spravuje 17 000 objektů. Ve srovnání s těmito čísly se počet objektů v repozitáři KU – 717 dokumentů – zdá malý, nicméně lze předpokládat, že v budoucnu poroste.
Repozitář KU je nutno zařadit do kontextu standardní problematiky vědecké komunikace:
- otázka rostoucí ceny odborných časopisů,
- potřeba elektronického přístupu k plným textům,
- potřeba získání, správy, uchování a zpřístupnění obsahu vytvářeného pracovníky univerzity – výsledků práce univerzity ,
- nutnost registrace a zpřístupnění materiálů vytvořených primárně v digitální podobě a v neposlední řadě
- důležitost „open access“ – tedy přístupu k plným textům dokumentů bez omezení v podobě drahých licencí či konsorciálních smluv často omezujících svobodné nakládání s informacemi.
Sedm důvodů
Rosenblum uvedl sedm důvodů, proč budovat a používat repozitář KU:
- viditelnost – jak pro lidské zájemce, tak pro roboty indexující webový obsah pro vyhledávače. Nabízí se lákavý argument – dokumenty dostupné zdarma v prostředí WWW jsou citovány častěji, než dokumenty dostupné prostřednictvím placených kanálů. [Pozn. autora: je otázkou, zda je tento argument obecně platný ve všech oborech odborné vědecké komunikace]
- stabilita – každý dokument uložený v repozitáři je vybaven URL adresou, která je stálá, citovatelná a která bude „na věčné časy“ platná a neměnná. Pro zajištění stability odkazů jsou užity identifikátory URI systému Handle.Net dle internetové specifikace RFC 3650.
- trvanlivost – repozitář plní funkci úložiště, které je odborně spravováno, zálohováno a zpřístupněno dle platných technických standardů vyhledávačům i webových prohlížečům. Platí, že dokumenty jsou udržovány ve formátech, které jsou ve chvíli získání a vyžádání dokumentu uživatelem použitelné, a že technologický vývoj je respektován i za cenu nutné konverze do kvalitnějšího nebo aktuálnějšího datového formátu zaručujícího plnou využitelnost a dostupnost.
- flexibilita – technologie repozitáře zaručuje podporu různých typů obsahu a souvisejících datových formátů (texty, obrázky, audio- a videomateriály). Jde zejména o pracovní a podkladové studie, preprinty a články již publikované v příslušných odborných periodických titulech, technické zprávy, konferenční materiály, knihy, datové soubory, počítačové programy, multimediální publikace, webové stránky a AV soubory .
- pohodlí – připojení ke komunitě vytvářející obsah je snadné, stejně tak je jednoduché ukládání materiálů do repozitáře. Administrativní zátěž je minimalizována.
- vyhovění legislativním požadavkům – repozitář KU splňuje požadavky na publikování výsledků vědeckovýzkumné práce požadované institucemi poskytujícími federální granty (nutnost zpřístupnění výsledků výzkumu do šesti měsíců). Bude-li v USA schválen návrh zákona US Federal Research Public Access Act (FRPAA), který je podporován knihovnami a naopak nepodporován vydavateli, stane se zveřejňování výsledků zdarma online nejpozději šest měsíců po publikaci v recenzovaných časopisech povinným. Již od května loňského roku je podobný požadavek uplatňován pro výsledky výzkumu financovaného Národními zdravotnickými ústavy (National Institutes of Health, NIH), byť výsledky lze zatím pokládat za spíše neuspokojivé (viz http://publicaccess.nih.gov/).
- úspora nákladů – služby jsou poskytovány akademické obci KU zdarma. Centralizovaná správa úložiště zbavuje jednotlivé součásti univerzity odpovědnosti za údržbu systému.
Z technologického hlediska je repozitář založen na systému DSpace vyvíjeném Masssachusettským technologickým institutem (Massachusetts Institute of Technology). Správu zajišťuje oddělení IT KU společně se třemi knihovníky z oddělení knihoven. Důležitou komponentou systému je systém autentizace využívající stále populárnější infrastrukturu Shibboleth.
Ve své podstatě může repozitář tohoto typu vytvářet alternativu jak k bibliografiím založeným na povinném výtisku (neboť je v zájmu samotného vědce, aby výsledky jeho práce byly publikovány a citovány), tak k publikování vlastních prací na osobních stránkách vědce, neboť tyto stránky mohou být časem zrušeny či přesunuty apod.
Sběr metadat
Systém je založen na komunitním modelu, kdy obsah může poskytovat kdokoli z univerzity pomocí samoobslužných formulářů. Příslušná metadata do nich zapíše a plný text připojí přímo autor či sekretářka oddělení. Brian Rosenblum srovnal tento model s praxí využívanou při budování repozitáře na Michiganské univerzitě, do kterého jsou předávány plné texty ve formátu PDF přímo od oficiálního vydavatele – společnosti Elsevier, což zajišťuje větší přírůstek dokumentů.
Budování repozitáře je všeobecně podporováno vedením univerzity, např. děkanát sponzoruje propagační akce a semináře, akademický senát rozhodl o podpoře této formy vědecké komunikace, vedení univerzity se účastní práce v poradním výboru repozitáře.
Důležitou pomůckou využívanou při poskytování dokumentů do repozitáře je webová služba SHERPA/RoMEO, informující autory o případných copyrightových omezeních uplatňovaných cca 100 vydavateli a několika tisíci vědeckých časopisů. SHERPA/RoMEO nabízí údaje o podmínkách, za nichž autoři mohou sami dále zveřejňovat a využívat texty publikované v časopisech a jednotlivé vydavatele označuje barvami „dle přívětivosti“ k alternativním modelům publikování (preprinty, postprinty aj.). Systém SHERPA/RoMEO tak slouží k identifikaci vydavatelů podporujících repozitář.
Nedílnou součástí procesu poskytnutí textu do repozitáře je podepsání dodatku ke smlouvám s vydavateli.
Doporučení
Brian Rosenblum pro účely budování institucionálních repozitářů stanovil několik doporučení, které lze chápat univerzálně:
- ve vztahu k univerzitě se chovat proaktivně, propagovat repozitář všemi dostupnými kanály,
- oslovovat autory a připomínat jim, aby zasílali metadata a dokumenty,
- účastnit se prezentací fakult a jednotlivých oddělení,
- osobně navštěvovat jednotlivá oddělení,
- využívat možnosti sociální interakce při společných obědech apod.,
- informovat o copyrightu a možnostech publikování,
- klást důraz zejména na poskytování služeb univerzitě, nikoli na růst počtu záznamů,
- realizovat vazby na ostatní digitální sbírky a projekty v rámci univerzity i mimo ni.
Další kroky:
- sledovat budoucí vývoj systému DSpace
- zajistit interoperabilitu s jinými systémy (DPubS – publikační systém pro vědeckovýzkumné projekty na bázi otevřeného přístupu, XTF – rozhraní a nástroj pro prohledávání digitálních sbírek různých typů využitý např. v projektu California Digital Library)
Statistiky:
- celkem záznamů: 717
- 38 oborově vymezených komunit
- v dubnu 2006 bylo zobrazeno 15 000 záznamů a provedeno 2600 hledání
Na adrese https://kuscholarworks.ku.edu/dspace se s repozitářem a jeho obsahem můžete seznámit i vy, čtenáři Ikara. Pokud vás problematika institucionálních repozitářů zaujala, navštivte webovou stránku centrálního OAI repozitáře OAIster, která mj. obsahuje přehled několika set repozitářů z celého světa.