Online archivní databáze americké NARA
V tomto příspěvku je jednak krátce shrnuta úloha NARA [4] (National Archives and Records Administration) v americkém prostředí, jednak jsou ukázány vyhledávací možnosti v archivních databázích dostupných online.
Pole působnosti NARA
NARA je nezávislá federální agentura USA, která se zabývá uchováváním americké národní historie. Ve vizi NARA je však hned v první větě vyvrácena představa zaprášených historických dokumentů. Naopak je zdůrazněno, že se jedná o veřejný fond, který výrazně přispívá k rozvíjení americké demokracie. Prostřednictvím dokumentace totiž mimo jiné umožňuje občanům kontrolovat činnost vlády.
Posláním NARA je zajišťovat pro občany, veřejnou správu, prezidenta, Kongres a soudy rychlý přístup k důležitým dokumentům. Za účelem splnění svého poslání NARA vytváří vždy na deset let strategický plán, který je však každé tři roky aktualizován. Nynější plán zahrnuje roky 1997-2008 a nejnověji byl aktualizován v roce 2003. V předmluvě k této aktualizaci John W. Carlin, který zastává vedoucí post ředitele archivu, mimo jiné klade důraz na elektronické dokumenty, jejich udržování, uchovávání a zpřístupňování. Množství elektronických dokumentů je věnována stejná pozornost jako nejslavnějším americkým archivním dokumentům – Prohlášení nezávislosti, Ústavě USA a Listině svobod. Tyto a mnohé další význačné dokumenty americké historie jsou mimochodem dostupné v digitalizované podobě v sekci Exhibit Hall [5].
Velmi podstatnou věcí, která je rovněž zdůrazněna v nynějším strategickém plánu NARA, je konstatování, že navzdory dřívějším představám o plně elektronické komunikaci je neustále produkováno velké množství papírových dokumentů. Narůstají však také požadavky uživatelů, kteří očekávají okamžitý elektronický přístup k informacím, a v této oblasti je stále mnoho nedořešených otázek.
Přístup k archivním databázím
V souladu s posledně jmenovanou částí strategického plánu NARA jsou na internetové adrese www.archives.gov/aad [6] zpřístupněny archivní databáze. Pod zkratkou AAD v adrese se skrývá Access to Archival Databases, tedy Přístup k archivním databázím.
Většina elektronických záznamů, které jsou prostřednictvím systému AAD k dispozici, časově pokrývá období od šedesátých let 20. století do současnosti. Nejstarší elektronické záznamy pocházejí z období druhé světové války. Byly také vytvořeny elektronické verze menšího množství záznamů z 19. století. Ze stránek NARA [7] lze získat celkový přehled o záznamech nabízených v elektronické podobě.
Pro zvýšení přehlednosti byly jednotlivé datové soubory uspořádány do řad (series). Zatím je jich zpřístupněno přes třicet. Zahrnují více než tři sta padesát datových souborů. V datových souborech je obsaženo přes padesát milionů jedinečných záznamů.
Některé z řad slouží jako rejstříky, tedy přístupové cesty k archivním záznamům, které nejsou k dispozici v elektronické podobě. Systém AAD neumožňuje kvantitativní či statistickou analýzu dat.
Pro uživatele, kteří hledají v těchto archivních databázích poprvé, je připraveno hned několik pomůcek. Zmínila bych nejprve grafický i slovní popis [8] celého procesu vyhledávání. Ke grafickému vyjádření je možno se ve všech fázích vracet kliknutím na odkaz "Where am I?" (Kde to jsem?). Konkrétní fáze je v rámci schématu zvýrazněna.
Další užitečnou pomůckou je velmi názorný příklad vyhledávání [9], v němž je ukázán postup při vyhledávání podrobnějších informací o Quentinu Smithovi, o němž na začátku víme pouze to, že kdysi sloužil v armádě a že byl zraněn v korejské válce. Výsledkem vyhledávání je informace o tom, že 28. března 1953 byl vojín Quentin R. Smith z Franklin County v Maine zraněn střelou ve vojenské akci a byl hospitalizován. Zjistíme také, že zpět do služby se vrátil 30. června téhož roku. Každý provedený krok vyhledávání je dokumentován zachyceným oknem internetového prohlížeče.
Přípravná fáze vyhledávání obecně probíhá takto:
Uživatel si vybere řadu, o níž se domnívá (nebo ví), že obsahuje vhodný datový soubor. Řady je možno vybírat podle:
- předmětu – z několika desítek předmětů jmenujme pro přiblížení například americkou občanskou válku (1861-1865) nebo geologii
- geografické oblasti – jimi jsou země, města a okresy USA, jednotlivé státy USA a poštovní směrovací čísla
- organizace – zde si je možno vybrat z komerčních, vládních a neziskových organizací
- období – zde je třeba dát pozor na různou délku jednotlivých období – zatímco 19. století (přesněji řečeno léta 1800-1899) není dále členěno, 20. století je již rozděleno na kratší úseky (od roku 1955 mají délku 10 let)
- tvůrce – tato skupina je rozčleněna na vládní organizace (civilní či vojenské) a soukromé zdroje
Řady jsou popsány prostřednictvím nejrůznějších atributů, podle nichž se může uživatel ujistit, zda daná řada odpovídá jeho požadavku. Patří mezi ně například:
- název řady
- tvůrce, resp. tvůrci (organizace, které se na vytváření řady podílely)
- typ archivních materiálů (např. datové soubory, textové záznamy)
- úroveň popisu (širší skupina dokumentů, do níž řada patří)
- jiný název, pod nímž je řada také známa
- lokace (fyzická adresa umístění dokumentů, kontakty na dané pracoviště)
- období pokrytí (časové období, během něhož byla příslušná dokumentace sbírána)
- funkce a využití (zde jsou zahrnuty i poznámky k historickému vývoji shromažďování dokumentace)
- několik druhů poznámek (např. k rozsahu a obsahu)
- indexační termíny (předměty)
Podobným, byť stručnějším způsobem jsou popsány jednotlivé datové soubory.
Po výběru příslušného datového souboru následuje samotné vyhledávání. Nejprve je vhodné prohlédnout si příklady (vzorové hodnoty, sample values), z nichž je patrný správný formát zadání dotazu. Dále je v nabídce skenovaná dokumentace (není však dostupná ve všech případech), vzhled předkládaných dat a vyhledávací tipy.
Uživatel si určí operátory použité pro jednotlivé sloupce tabulky (obsahuje všechny hodnoty, obsahuje jakoukoli hodnotu nebo obsahuje frázi) a hodnoty (v některých případech je možno vybírat z připraveného seznamu, respektive slovníku, je také možno používat znaky rozšíření % či *).
Stroj následně provede vyhledávání a zobrazí výsledky. Se systémem AAD se pracuje jako s databází, takže je například možno záznamy řadit od nejvyšších hodnot k nejnižším či naopak. Záznamy je rovněž možno zobrazovat a samozřejmě je také stahovat (ve formátu csv) a tisknout. Zobrazení záznamu má na rozdíl od zobrazení seznamu výsledků navíc uživateli nabízí ve sloupci Meaning vysvětlení daného kódovaného údaje (např. rozpis zkratky či převedení data do standardizovaného formátu).
Celkové hodnocení
Množství archivních dokumentů NARA přístupných online je úctyhodné. Při vytváření systému AAD byla proto značná pozornost věnována efektivním vyhledávacím prostředkům. Uživateli je proto například umožněno ptát se na datum v jediném formátu, přestože ve zdrojových datech se pochopitelně vyskytují formáty různorodé.
Grafické zpracování rozhraní upoutá jednoduchostí, použitím decentních barevných kombinací a vždy jasně viditelným červeným tlačítkem Search. Z hlediska navigace si naši pozornost zaslouží ten fakt, že je vždy jasně patrné, ve které fázi vyhledávání (ať už přípravné či vlastní) se uživatel nachází. Pokud by si přesto nebyl jist, je mu nabídnuto příslušné vysvětlení prostřednictvím linku "Where am I?" a rovněž bližší instrukce vztahující se ke konkrétní fázi. Vyhledávání lze tedy považovat za uživatelsky přívětivé. Případné komentáře či návrhy na vylepšení systému AAD lze zasílat na adresu CER@nara.gov [10].
Ještě si dovolím jednu obecnější poznámku na závěr. Pozitivní hodnocení si totiž dle mého názoru zaslouží také upozornění uživateli v případě, že se prostřednictvím některého z odkazů chystá opustit stránky pod patronací NARA.
Obsah:
Forma:
Navigace:
(Poznámka: Nejnižší známka je jedna hvězdička, nejvyšší pět.)