Nová Digitální veřejná americká knihovna
Úvod
18. dubna 2013 byla v Bostonu ve Spojených státech amerických zprovozněna nová Digitální veřejná americká knihovna (anglicky The Digital Public Library of America, dále jen zkratka DPLA). Knihovna představuje výsledek téměř tříletého úsilí Berkmanova centra pro internet a společnost (Berkman’s Center for Internet and Society) při Harvardské univerzitě zpřístupnit široké veřejnosti bohatství amerických informačních a kulturních institucí – knihoven, archivů a muzeí.
Knihovnu v současné době provozuje stejnojmenná společnost (Digital Public Library of America, Inc.) a nabízí přístup k více než 4,5 milionu záznamů digitálního obsahu různých typů materiálů: fotografiím, rukopisům, starým tiskům, knihám, zvukovým i audiovizuálním nahrávkám (viz obr .č .1). Vše je samozřejmě dostupné zdarma uživatelům z celého světa.
[4]
Obrázek 1 - Hlavní stránka Digitální veřejné americké knihovny
Vývoj projektu digitální knihovny
Historie projektu DPLA se začala psát v říjnu 2010, kdy bylo na konferenci v Cambridge (Massachusetts) rozhodnuto o zahájení spolupráce představitelů předních amerických knihoven, nadací a archivů s cílem vytvořit „otevřenou, distribuovanou síť komplexních online zdrojů, která by čerpala z národního kulturního dědictví uloženého v knihovnách, archivech, univerzitách a muzeích USA a sloužila tak ke vzdělání a poučení současných i budoucích generací“[1].
V prosinci 2010 získalo Berkmanovo centrum pro internet a společnost finanční podporu od Nadace Alfreda P. Sloana (angl. Alfred P. Sloan Foundation), neziskové organizace, která tímto způsobem napomáhá výzkumu a vzdělání v oblastech přírodních věd, matematiky a ekonomie[2]. Zároveň byli svoláni přední odborníci z oborů knihovnictví, informačních a komunikačních technologií, práva a vzdělávání, aby zahájili práci na projektu DPLA.
V následujících dvou letech se do projektu zapojily stovky knihovníků veřejných i specializovaných knihoven, informačních pracovníků, inovátorů a dobrovolníků, kteří byli rozděleni do šesti pracovních skupin pod vedením Řídícího výboru (angl. Steering Committee). Jejich snahy vyvrcholily v dubnu 2013, kdy byla spuštěna beta verze portálu DPLA na adrese http://dp.la [5][3]. Vedle národního digitálního archivu Americká paměť (angl. American Memory[4]) provozovaného Kongresovou knihovnou ve Washingtonu D.C. od roku 1995 se tak jedná o další úspěšný počin na celonárodní úrovni, který si klade za cíl zpřístupnit kulturní dědictví skrze jednotnou otevřenou platformu.
Řízení a financování DPLA
V čele knihovny DPLA stojí výkonný ředitel Dan Cohen a její politiku a další vývoj určuje představenstvo složené z předních odborníků v oborech informační vědy a knihovnictví, výpočetní techniky, průmyslového vlastnictví a ekonomie, mezi kterými figuruje například Catherine Casserly, výkonná ředitelka Creative Commons, nebo Robert Darnton, zakladatel online digitálního archivu elektronických knih Gutenberg-e a významný expert na problematiku digitálních knihoven.
Důležitou součástí organizační struktury jsou také specializované komise (Operational a Board Committees). Jejich úkolem je radit výkonnému řediteli a představenstvu v otázkách dlouhodobé strategie spravování digitálního obsahu, autorského práva, marketingové strategie a technického vývoje digitální knihovny a především také zhodnotit její finanční operace.
Knihovna DPLA má z legislativního hlediska postavení neziskové organizace. Ekonomická stránka jejího provozu je tedy zajištěna skrze grantové příspěvky partnerských organizací – vedle výše uvedené Nadace Alfreda P. Sloana přispívají také Fond Arcadia (angl. Arcadia Fund), Institut muzejních a knihovnických služeb (angl. Institute of Museum and Library Services), Nadace Johna S. a Jamese L. Knightových (angl. John. S. and James L. Knight Foundation) a Národní nadace pro humanitní vědy (angl. National Endowment for the Humanities).
Knihovna DPLA také úzce spolupracuje s řadou národních i mezinárodních organizací, které usilují o zachování a zpřístupnění kulturního dědictví. Je členem Národní aliance pro digitální správcovství (angl. National Digital Stewardship Alliance, NDSA). Hlavním cílem aliance je zajistit a zachovat přístup k národním digitálním zdrojům; kromě toho od října 2011 směřuje také k zabezpečení interoperability digitálního obsahu s panevropským projektem Europeana. Opomenout nelze ani ambiciózní iniciativu OpenGLAM[5], která prosazuje otevřený přístup k digitalizovaným sbírkám kulturních institucí po celém světě.
Organizační struktura
DPLA jako celek funguje na principu síťového modelu s centrálním portálem spojujícím jednotlivé uzly (angl. hubs). Tyto uzly jsou reprezentovány členskými institucemi a jejich digitálními systémy a podle funkce je lze rozlišit na dva typy: servisní uzly (angl. Service Hubs) a obsahové uzly (angl. Content Hubs).
Jako servisní uzly slouží regionální digitální knihovny, které shromažďují informace o digitálních objektech z knihoven, archivů, muzeí a depozitářů ve své oblasti – plní tedy funkci agregátorů metadat. Každá tato regionální DK skrze standardizovaný balíček služeb napomáhá příslušným kulturním institucím s jejich digitalizačními snahami a ve výsledku tak vytváří rozsáhlou síť přispěvatelů, jejichž obsah je volně přístupný z jednotného rozhraní DPLA. V současné době je do DPLA zapojeno celkem 7 servisních uzlů:
- Digitální společenství (angl. Digital Commonwealth, pro stát Massachusetts) - http://www.digitalcommonwealth.org/ [6]
- Georgijská digitální knihovna (angl. Digital Library of Georgia) - http://dlg.galileo.usg.edu/ [7]
- Kentucká digitální knihovna (angl. Kentucky Digital Library) - http://eris.uky.edu/ [8]
- Minnesotská digitální knihovna (angl. Minnesota Digital Library) - http://www.mndigital.org/ [9]
- Západohorská digitální knihovna (angl. Mountain West Digital Library, pro státy Utah, Nevada a Arizona) - http://mwdl.org/ [10]
- Oregonská digitální knihovna (angl. Oregon Digital Library) - http://odl.library.oregonstate.edu/ [11]
- Severokarolínská digitální knihovna (angl. South Carolina Digital Library) - http://www.scmemory.org/ [12]
Roli obsahových uzlů plní velké digitální knihovny, archivy a repozitáře, jejichž digitální fond tvoří minimálně 250 tisíc jedinečných záznamů metadat a vlastních obsahů vyhovujících mezinárodním standardům, nezávisle na geografickém umístění. Podle Dohody o výměně dat (angl. Data Exchange Agreement)[6] jsou zavázány s knihovnou DPLA své záznamy sdílet a v případě potřeby editovat. K dnešnímu dni je ke knihovně připojeno celkem 12 obsahových uzlů:
- Digitální knihovna ARTstor (angl. ARTstor Digital library) - http://www.artstor.org/ [13]
- Digitální fondy konsorcia Knihovna dědictví biologické diverzity (angl. Biodiversity Heritage Library) - http://www.biodiversitylibrary.org/ [14]
- Digitální fond Sbírky map Davida Rumseyho (angl. David Rumsey Map Collection) - http://www.davidrumsey.com/ [15]
- Speciální digitální sbírky Harvardské knihovny (angl. The Harvard Library) - http://lib.harvard.edu/digital-collections [16]
- Digitální knihovna HathiTrust (angl. HathiTrust Digital Library) - http://www.hathitrust.org/ [17]
- Internetový archiv (angl. Internet Archive) - https://archive.org/ [18]
- Digitální fondy Národního archivu (angl. National Archives) - http://www.archives.gov/ [19]
- Digitální sbírky Newyorské veřejné knihovny (angl. New York Public Library) - http://www.nypl.org/ [20]
- Digitální sbírky Smithsonova institutu (angl. The Smithsonian Institution) - http://www.si.edu/ [21]
- Digitální sbírky Illinoiské univerzity v Urbana Champaign (angl. The University of Illinois at Urbana Champaign) - http://digitallibrary.usc.edu/ [22]
- Digitální knihovna Univerzity v Jižní Kalifornii (angl. USC Digital Library)
- Digitální sbírky Virginské univerzity (angl. The University of Virginia) - http://www.library.virginia.edu/collections/ [23]
Struktura a velikost digitálního obsahu
Knihovna DPLA svým uživatelům zpřístupňuje metadata celkem 8 různých typů digitálních objektů: textových, obrazových, zvukových, audiovizuálních, fyzických objektů, sbírek, služeb a interaktivních zdrojů.
Kromě toho nabízí přístup k 8 tematicky různě zaměřeným online výstavám (za zmínku rozhodně stojí například výstava týkající se prohibice ve Spojených státech, aktivismu nebo Velké hospodářské krize), které spravují partnerské instituce DPLA. Tyto výstavy tvoří soubory digitalizovaného fotografického materiálu s doprovodným textem.
K 19. říjnu 2013 nabízí digitální knihovna DPLA přístup ke 4 618 290 metadatových záznamů digitálních zdrojů. Na základě údajů o době vzniku primárních dokumentů bylo možno určit, že největší množství jich pochází z roku 2003 (56 650 záznamů). Z hlediska typu dokumentu pak výrazně převažují záznamy textových zdrojů (2 678 438 záznamů). Podstatně nerovnoměrné rozdělení lze identifikovat i v případě jazyka původních zdrojů, kde jednoznačně dominuje angličtina (1 648 494 záznamů; vedle světových jazyků je však v obsahu knihovny DPLA zastoupena i čeština s 3 255 záznamy).
Metadata
DPLA používá vlastní interní metadatové schéma Metadatový aplikační profil DPLA (angl. DPLA Metadata Application Profile, dále jen zkratka MAP), které staví na zkušenosti s Datovým modelem systému Europeana (angl. Europeana Data Model, jedná se o metadatový standard portálu Europeana[7]) a vychází vstříc dalším běžně užívaným formátům, jako jsou například Dublin Core nebo MODS. Metadatové schéma MAP také začleňuje zpětnou vazbu od komunity uživatelů a účastníků projektu DPLA, která napomáhá vytvoření vyváženého rámce umožňujícího práci s existujícími i teprve vznikajícími datovými modely digitálních zdrojů. Do budoucna také DPLA počítá s využitím modelu RDF.
Ke komunikaci metadat mezi centrálním portálem a jednotlivými uzly je využíván protokol OAI-PMH. Periodicita sklízení je prozatím nepravidelná, respektive se podle slov producenta odvíjí od institucionální potřeby.
Samotné záznamy digitálních objektů jsou tvořeny následujícími popisnými údaji:
- Tvůrce (fyzická osoba nebo instituce/organizace)
- Datum vytvoření (může mít podobu určitého data nebo časového intervalu)
- Poskytovatel záznamu (respektive určitý servisní nebo obsahový uzel)
- Instituce vlastnící primární dokument
- Nakladatel (pouze v případě textových dokumentů a zdrojů typu služba)
- Popis (abstrakt nebo stručný obsah)
- Místo (konkrétní místo, ke kterému se obsah dokumentu vztahuje)
- Formát (pouze v případě zvukových dokumentů a zdrojů typu služba a fyzický objekt)
- Typ zdroje (přesný typ zdroje)
- Předmětová hesla (jednoslovné nebo víceslovné termíny charakterizující obsah dokumentu)
- Práva (autorsko-právní status dokumentu)
- URL (respektive hypertextový odkaz na původní záznam, popřípadě primární dokument na stránkách poskytovatele).
[24]
Obrázek 2 - Ukázkový záznam zvukového zdroje
Problematika autorských práv
Přestože provozovatelé DPLA svým uživatelům garantují volný, bezplatný a neomezený přístup k národnímu kulturnímu dědictví, autorskoprávní status dokumentů je do značné míry nejednotný. Tento stav je způsoben faktem, že vlastníky primárních dokumentů jsou zprostředkovatelské instituce, servisní a obsahové uzly, nikoliv knihovna DPLA samotná. V případě děl, u nichž tedy ještě neuplynula doba autorsko-právní ochrany, se tak uživatel dostane do situace, kdy je mu přístup k nim bezpodmínečně odepřen. Obsahový uzel Digitální knihovny Hathi Trust pro taková díla nabízí alespoň účinný prohledávací nástroj, který umožňuje zjistit frekvenci a pozici (stránku) výskytu daného výrazu nebo fráze v textu a napomoci tak uživateli v rozhodnutí, zda si dokument komerčně nebo jinak pořídit.
Vyhledávání informací
Vyhledávání lze v rámci DPLA realizovat dvěma základními způsoby: dotazovým vyhledáváním pomocí vyhledávacího okna nebo jednoduchým prohlížením.
První uvedený způsob funguje na základě klasického principu zadání vyhledávacího dotazu, na jehož základě systém vyhledávání provede nad indexem metadatové databáze a následně uživateli nabídne dle relevance uspořádanou množinu výsledných metadatových záznamů. Tu lze poté omezit na základě faset údajů zobrazených na levé straně (viz obr. č. 3): formátu, instituce vlastnící primární dokument, konkrétního servisního nebo obsahového uzlu, data vzniku (lze nastavit i časový interval), jazyka zdroje, místa a předmětových hesel. Jednotlivá kritéria lze samozřejmě dále kombinovat.
[25]
Obrázek 3 - Náhled množiny výsledků a faset údajů
V dotazovém základním vyhledávání lze využít i booleovských operátorů AND, OR a NOT. Pokročilé vyhledávání však systém vůbec nenabízí.
Režim prohlížení uživatelům umožňuje volně procházet seznamy předmětových hesel nebo využít interaktivní mapy (viz obr. č. 4) a detailně zpracované časové osy k nalezení záznamů vztahujících se ke konkrétnímu místu nebo době. Potřeba je však zmínit omezení těchto nástrojů – mapa zahrnuje pouze oblast Severní Ameriky a časová osa začíná rokem 1000 n. l. Výrazný nedostatek lze spatřit zejména u předmětových hesel, která nejsou uspořádána do hierarchických struktur ani kategorií a neumožňují jiný způsob prohlížení než podle abecedy nebo množství záznamů, kterých se týkají. Navíc nejsou přítomna ve všech záznamech, takže uživatel nemá možnost objevit záznamy, ke kterým by jinak dospěl dotazovým vyhledáváním.
Na obr. č. 3 lze vidět zkrácené záznamy, které obsahují pouze údaje o typu zdroje, názvu, tvůrci, popis a hypertextový odkaz na úplný záznam. Ten je uživateli nabízen v jediném výstupním formátu (viz obr. č. 2).
[26]
Obrázek 4 - Náhled interaktivní mapy
Uživatelský přístup
DPLA svým návštěvníkům umožňuje bezplatnou registraci a vytvoření uživatelského účtu. Z hlediska zobrazování záznamů a samotných primárních dokumentů sice nenabízí žádné výhody oproti neregistrovaným uživatelům, na druhou stranu disponuje užitečnými nástroji pro správu záznamů. Umožňuje ukládat formulace rešeršních dotazů (Saved Searches), vytvářet seznamy záznamů podle specifických kritérií (Saved Items and Lists), přičemž je u nich možné nastavit, aby byly buď soukromé, nebo viditelné pro všechny. Uživatelský účet také plně spolupracuje s účty na sociálních sítích – Facebooku, Twitteru a Google +.
Webové rozhraní
Webové rozhraní DPLA je koncipováno přehledně a účelně. Již na hlavní stránce (viz obr. č. 1) uživatelům nabízí vyhledávací pole i dílčí odkazy na online výstavy, interaktivní mapu a výše uvedenou časovou osu. Nezbytnou součástí jsou také neustále aktualizované odkazy na aktuality týkající se provozu DPLA a nejnovější příspěvky na jejích twitterových stránkách. Kromě toho jsou přítomny hyperlinky na FAQ, nápovědu, kontakt na provozovatele a podmínky užití digitální knihovny.
Webové rozhraní je lokalizováno výhradně v anglickém jazyce.
Portál DPLA také plně vyhovuje standardům otevřeného webu. Je kódován platnou specifikací HTML 5 a CSS3 a vychází vstříc všem pravidlům metodiky WCAG 2.0. Jednotlivé prvky webového rozhraní jsou také dostupné v základním stavu s vypnutým JavaScriptem.
Slovo závěrem
DPLA představuje po kvantitativní i kvalitativní stránce velmi vydařený projekt národní digitální knihovny. Její digitální obsah zatím dosahuje poloviny velikosti fondu Americká paměť, provozovaného Kongresovou knihovnou, což ji řadí mezi nejrozsáhlejší digitální knihovnu nejen ve Spojených státech, ale i na celém světě. Vyniká také rozmanitostí zpřístupňovaných materiálů, ze kterých lze vyzdvihnout zejména interaktivní zdroje a služby.
Pozoruhodná je DPLA také z časového hlediska, respektive za jak relativně krátkou dobu stihli její tvůrci vybudovat plně funkční model (práce byly zahájeny na sklonku roku 2010).
Na druhou stranu je potřeba uvést také některé podstatné nedostatky. Těmi jsou zejména nekompletní metadatový popis jednotlivých zdrojů (počet popisných údajů výrazně kolísá nejen mezi různými typy digitálních objektů, ale i v rámci jednoho typu) a z hlediska uživatelské práce se systémem také nepřítomnost pokročilého vyhledávání.
- About the Foundation. In: Alfred P. Sloan Foundation [online]. New York (New York): Alfred P. Sloan Foundation, ca 2000 – [cit. 2013-10-18]. Dostupný z: http://www.sloan.org/ [27].
- American Memory [online]. Washington (D.C.): U.S. Library of Congress, 1995- [cit. 2013-10-18]. Dostupný z: http://memory.loc.gov [28].
- DIGITAL PUBLIC LIBRARY OF AMERICA. DPLA Data Exchange Agreement [online]. Legal Version 3.0 of 10/09/2012. 2013 [cit. 2013-10-22]. Dostupný z: https://docs.google.com/document/d/1miWM3fuWIzmsvsQmbdKhOrx9_Hpp3CWSWBZVLCxGgeU/edit?pli=1 [29].
- DPLA – Digital Public Library of America [online]. Boston (Massachusetts): Digital Public Library of America, Inc., 2013- [cit. 2013-10-18]. Dostupný z: http://dp.la [5].
- Europeana [online]. The Haague : National Library of the Netherlands, 2008 [cit. 2013-10-18]. Dostupný z: http://www.europeana.eu/portal/ [30].
- DPLA – Digital Public Library of America [online]. Boston (Massachusetts): Digital Public Library of America, Inc., 2013- [cit. 2013-10-07]. Dostupný z: http://dp.la [5].
- About the Foundation. In: Alfred P. Sloan Foundation [online]. New York (New York): Alfred P. Sloan Foundation, ca 2000 – [cit. 2013-10-07]. Dostupný z: http://www.sloan.org/ [27].
- Doména .la byla původně výhradně kódem národní domény nejvyššího řádu pro stát Laos, nicméně od roku 2013 je také kódem městské domény pro Los Angeles a k dispozici ke komerčnímu využití.
- American Memory [online]. Washington (D.C.): U.S. Library of Congress, 1995- [cit. 2013-10-03]. Dostupný z: http://memory.loc.gov [28].
- Jedná se o iniciativu Nadace pro otevřené znalosti (angl. Open Knowledge Foundation), která prosazuje volný a otevřený přístup ke kulturnímu dědictví uloženému v galeriích, knihovnách, archivech a muzeích (GLAM – Galleries, Libraries, Archives and Museums).
- DIGITAL PUBLIC LIBRARY OF AMERICA. DPLA Data Exchange Agreement [online]. Legal Version 3.0 of 10/09/2012. 2013 [cit. 2013-10-22]. Dostupný z: https://docs.google.com/document/d/1miWM3fuWIzmsvsQmbdKhOrx9_Hpp3CWSWBZVLCxGgeU/edit?pli=1 [29].
- Europeana [online]. The Haague : National Library of the Netherlands, 2008 [cit. 2013-10-18]. Dostupný z: http://www.europeana.eu/portal/ [30].