Sdílení bibliografických údajů: šance nebo risk pro knihovníky v éře Web 2.0? (Patrick Danowski)
Workshop [4] P. Danowského [5] z Berlínské státní knihovny [6] (Staatsbibliothek zu Berlin) uvedl Filip Vojtášek ze společnosti Albertina icome Praha s.r.o. Zároveň poděkoval institutu CERGE-EI [7], v jehož prostorách se workshop konal, za spolupráci při jeho přípravě.
Na výzvu P. Danowského se všichni přítomní účastníci nejprve vzájemně stručně představili a vyjádřili rovněž svá očekávání týkající se workshopu. P. Danowski zdůraznil, že knihovny musejí nejprve učinit rozhodnutí, že data, která vytvářejí, chtějí sdílet, poté se je potřeba rozhodnout, s kým budou data sdílena. Připomněl definici otevřeného přístupu (Open Access) a podtrhl, že volné zpřístupňování dat (často se značkou copyrightu v patičce stránky) na webu neznamená totéž jako otevřený přístup. Zmínil Nadaci pro otevřené poznání [8] (Open Knowledge Foundation) a vznik hnutí za otevřená data. Důležitým faktorem je v tomto směru skutečnost, že takto by měla být zpřístupněna data, která byla vytvořena s využitím veřejných prostředků. Vedoucí workshopu představil i ukázku Projektu Otevřené knihovny [9] (Open Library Project), nového projektu Internetového archivu [10] (Internet Archive). Jeho tvůrci přišli s myšlenkou vytvořit katalog všech knih, které kdy byly vydány. Ačkoliv se tento cíl může zdát na první pohled těžko splnitelný, stačí si vzpomenout na situaci před několika lety, kdy se zrodila myšlenka otevřené encyklopedie – Wikipedie. Ta dnes skutečně existuje, navíc se jedná o rozsahem největší encyklopedii, která byla dosud vytvořena. Navíc jsou vyvíjeny mechanismy pro kontrolu, resp. validaci jednotlivých článků (hesel) této encyklopedie (v německé verzi encyklopedie bylo zkontrolováno již přes 200 000 hesel). Projekt Otevřené knihovny nabízí uživatelům možnost katalogizovat knihy. Nezačíná však na zelené louce, snaží se získat ke spolupráci nakladatele a knihovny, aby mohla být využita již vytvořená data. Některé význačné knihovny (včetně např. Britské knihovny) však zatím spolupráci kategoricky odmítají.
P. Danowski zmínil i skutečnost, že např. při pokusech o využití dat produkovaných Kongresovou knihovnou ve Washingtonu je třeba brát v potaz fakt, že data jsou otevřená pouze na území Spojených států, mimo ně podléhají copyrightu. OCLC i Amazon patří mezi uzavřené zdroje. Data lze přitom sdílet na dvou úrovních – jednak dílčí data (např. jednotlivé záznamy), jednak všechna data (celé soubory či obsah celých databází). Otevřenými daty je míněna druhá zmiňovaná úroveň.
Knihovny by se proto měly zajímat i o otázky licencování – P. Danowski zmínil i licenční model Creative Commons [11] - na webu Creative Commons mohou uživatelé vyplnit jednoduchý dotazník [12] a díky tomu zjistit nejvhodnější formu licence. Uživatelům daného díla licencovaného pod Creative Commons je pak jasně naznačeno, jakým způsobem mohou dílo pro své účely použít. Kromě Creative Commons se rozvíjejí i tzv. Science Commons [13] - jejich tvůrci pracují na přípravě obdobné licence pro data.
P. Danowski dále hovořil o projektu LibraryThing [14], který uživatelům umožňuje katalogizovat si knihy, získávat obálky od Amazonu, vytvářet si vlastní virtuální knihovničky, stahovat data z téměř 700 zdrojů z celého světa (prostřednictvím protokolu Z39.50). LibraryThing nabízí také různá API (Application Programming Interfaces), tj. otevřená rozhraní. V souvislosti s tím byly zmíněny i služby typu mash-up, např. Flickr Maps [15].
Knihovny by měly uživatelům nabízet možnost znovuvyužití dat, aniž by se jich předtím uživatelé museli ptát a získávat jejich souhlas. Sdílení dat právě díky rozhraním typu API vesměs není z technického hlediska problémem. Kupodivu bývá snazší získávat data od nakladatelů než od knihoven – nakladatelé si přejí, aby se uživatelé dozvěděli o jejich vydané produkci.
Účastníci workshopu se následně věnovali diskusím v celkem čtyřech skupinách a zabývali se výhodami a nevýhodami sdílení dat a jejich otevřeného zpřístupňování.
Při prezentaci závěrů, k nimž jednotlivé skupiny dospěly, zazněly např. tyto názory:
- Je možné, že komerční organizace nechtějí příliš sdílet data z toho důvodu, že pro jejich vytvoření bylo nutné vynaložit značné investice.
- Zpřístupňování dat o vzácných, resp. jinak obtížně dostupných knihách u uživatelů vyvolává zvýšená očekávání ohledně přístupu k těmto dokumentům. Uživatelé nechtějí při zjišťování údajů navštěvovat řadu různých institucí, přejí si přístup z jednoho místa.
- Jsou-li data sdílena, nemusejí být znovu vytvářeny např. katalogizační záznamy, tím dochází k ušetření času a úsilí – obojí lze efektivněji využít pro jiné účely.
- Lze očekávat, že sdílení dat dále přispěje ke standardizaci.
- To, co bylo vytvořeno s využitím veřejných prostředků, by také mělo být zpřístupněno bez nutnosti vynakládání dalších financí.
- Knihovny a nakladatelé by měli data o nově vydávaných publikacích zpřístupňovat rychleji, aby je ostatní uživatelé (např. další knihovny) mohli co nejdříve využívat a nemusely být vytvářeny nové záznamy.
- Lze však očekávat, že např. knihovny se budou obávat možnosti zneužití poskytnutých dat.
- České knihovny skutečně data sdílejí, je však potřeba, aby je sdílely nejenom mezi sebou, ale také s uživateli v jejich prostředí.
- Většina diskutujících v jedné ze skupin vyjádřila nesouhlas se znovuvyužitím dat pro komerční účely.
- Pro otevřené zpřístupňování dat je nutné vytvořit příslušnou licenční politiku.
- Otevřeně zpřístupněná data by mohla být využita i např. pro účely testování knihovních softwarů s otevřeným zdrojovým kódem; programátoři by také na základě poskytnutých dat mohli vyvinout nová uživatelská rozhraní pro jejich prezentaci.
P. Danowski rovněž představil citační sofware Zotero [16] v podobě pluginu do internetového prohlížeče Firefox a mj. na příkladu německého souborného katalogu [17] a svého blogu Knihovna 2.0 a více [18] (Bibliothek 2.0 und mehr) ukázal, jakým způsobem lze Zotero využít ke správě záznamů. U zdrojů umožňujících přímé přebírání dat se objevuje příslušná ikona v prohlížeči v řádku s adresou. Zotero využívá metadatový formát COinS.
P. Danowski se ještě vrátil i k tematice Creative Commons, a to formou videa [19] z YouTube.
Karen Blakemanová, jedna z účastnic workshopu, zmínila i mikroblogovací systém Twitter [20], který P. Danowski stručně představil; dále se věnoval i systému Facebook [21], který může sloužit i jako prostředek k filtrování informací – k získávání nových informací prostřednictvím sítě přátel.
P. Danowski také shrnul některá možná využití otevřeného přístupu k datům, zmínil např. možnost využití při statistických výzkumech. Zdůraznil, že otevřené zpřístupňování dat představuje pro knihovny šanci poskytnout jejich produkty uživatelům.
V závěru workshopu přítomní účastníci akci zhodnotili; objevila se např. poznámka, že v rámci workshopu bylo položeno více otázek než poskytnuto odpovědí. To však není překvapivé, ostatně otevřené zpřístupňování dat je na samém počátku.
Patrick Danowski
Diskuse ve skupinách
Karen Blakemanová shrnuje výsledky diskuse jedné ze skupin
Účastníci workshopu
Autory fotografií jsou Linda Skolková a Filip Vojtášek.
(ls)