Přednosti a rizika digitálních dokumentů
Při svých hovorech okolo digitalizace historických knižních fondů se setkávám s tím, že pojmy digitalizace, rozlišení, komprese, nové formáty aj. se stávají automaticky synonymem vyšší kvality. Začíná se mluvit o digitálních knihovnách, které už jsou součástí našeho života. Je však dobré si uvědomit, v čem nová kvalita spočívá, a je nutno také vědět o druhé tváři nových technologií, o možných rizicích.
Co je digitalizace?
Předmětem digitalizace jsou obvykle informace určené pro náš sluch a zrak – digitalizace fotografie, telefonu, televize. Na otázku „proč digitalizace“ je také jednoduchá odpověď – vyšší kvalita. Podívejme se důkladněji na to, co je digitalizace. Platí jednoduchá definice, kterou je dobré si zopakovat a zamyslet se nad ní:
Digitalizace je převod vybraných měřitelných fyzikálních veličin objektu do numerických hodnot, jejich kódování, uložení a transport za účelem následného vygenerování jiných fyzikálních veličin s cílem umožnit uživateli fyziologické vjemy, obvykle nahrazující přímé vnímaní originálu.
Všimněme si, že stejné základní momenty snímání, uchování a transportu, reprodukce jsou přítomny i v tradičním, nedigitálním nakládání s informacemi. Vezměme příkladně klasickou fotografii. Stisknutí spouště zahájí proces převodu světla na změny fotocitlivého materiálu, po vyvolání máme obraz viditelně uložený (zakódovaný) na filmu, který můžeme transportovat, kopírovat nebo uchovat. Lze z něj vytvořit fotografie nebo jej promítat a umožnit tak vnímání toho, co viděla kamera. Proces snímání je analogový, nikoli digitální, a přesto nutno konstatovat, že informační obsah na dobře udělaném filmu je obvykle podstatně vyšší než při digitálním snímání na CCD čip při jinak stejných podmínkách. V čem je tedy kvalitativní přínos digitalizace? Počátek snímání je vždy analogový, pro digitalizaci je charakteristický převod informací (v počátečním stadiu analogových) do číselného tvaru, který přináší podstatně lepší možnosti zpracování, uchování a přenosu. V uchování a přenosu je tedy ten podstatný rozdíl. Každé uchování a přenos analogových informací je ztrátové a přináší obvykle zřetelnou ztrátou kvality. To známe z obehraných gramodesek nebo z televize při horším signálu. Podívejme se však na tyto vítané vlastnosti digitálního záznamu v jiných souvislostech.
Výhody a úskalí archivace digitálních dat
Z hlediska následujících úvah o digitalizaci historických dokumentů je podstatný jeden rys využívání digitální techniky – lze snadno zajistit neměnnost digitálních dat. Tato neměnnost je základem kvality, která je spojována s digitálními médii. Naproti tomu analogové zvukové záznamy, filmy a fotografie při nejlepší vůli a kvalitě zpracování stárnou a nezadržitelně ztrácejí svůj informačním obsah. Mikrofilmové archivy vydrží stovky a snad i tisíc let, ale jejich čas je každopádně konečný. Každé použití, každý den existence analogového záznamu znamená jistou degradaci média a nerozlučně i zaznamenané informace. Naproti tomu digitální informace nejsou s médiem tak pevně spojena. Zaznamenaná data jsou od média bezeztrátově oddělitelná a při jejich včasném přepisu na jiné médium (tzv. migraci) nedojde k jakékoli změně či ztrátě informace. Nevadí tedy, že životnost médií pro digitální záznam je řádově kratší než životnost pergamenu nebo mikrofilmu. Digitální data jsou ale evidentně závislejší na existenci techniky zajišťující jejich uchování, interpretaci, ale také na zajištění migrace. Zatímco krátká diskontinuita v naší civilizaci by nemusela znamenat ztrátu klasických dokumentů, digitální data mohou zmizet velmi snadno a beze zbytku. V každodenní praxi stačí málo - podcenit zálohování nebo pohostit vir v počítači. Hrozí i jiná nebezpečí. Stačí si jen vzpomenout na archivaci dat na velkých, pak malých disketách, magnetických páscích, pak na CD a DVD. Životnost všech těchto nosičů (fyzická i morální) je ve srovnání například s filmem podstatně kratší. Migrace dat je tedy nezbytná kvůli fyzickému stárnutí médií, na nichž jsou data uložena, i kvůli rychlým změnám techniky zajišťující uložení, uchování a interpretaci dat. Existuje však bohužel ještě další nebezpečí.
Pro interpretaci digitálních dat jsou nezbytné softwarové nástroje. Tyto nástroje a systémy se vyvíjejí velmi rychle, takže při nedodržení určitých principů se může stát, že data nebudou v nových systémech interpretovatelná. To platí zejména o formách, které nejsou veřejně deklarovaným a obecně používaným standardem. Z tohoto hlediska jsou nebezpečné zejména formy spojené s komerčními produkty. Typickým příkladem souborů nevhodných pro archivaci jsou soubory DOC, PDF, z nichž nedostanete informace bez konkrétních nástrojů. Krásným příkladem jsou formáty pro zpřístupnění dat digitalizovaných map nebo obrazů na internetu – formáty MrSID nebo ZoomIF, které dovolují efektivně prohlížet ohromné digitální obrazy na internetu.Všechny tyto formy jsou v denní praxi velmi užitečné a prakticky se bez nich neobejdeme. Budou však komerční nástroje pro interpretaci těchto formátů k dispozici za 10, za 20 let? Možná ano, ostatně můžeme si zazálohovat i nástroje. Budou ale k dispozici systémy pod nimiž tyto nástroje fungují? Asi ano, můžeme ostatně zazálohovat i systémy. Ale systémy jsou závislé na konkrétním hardware… To už je zřetelně absurdní, ukazuje to ale naprostou nezbytnost takové závislosti se vyhnout. Informace uložené ve formě digitálních dat mohou být nadneseně řečeno nesmrtelné. Musíme se ale starat o jejich migraci ze stárnoucích a umírajících médií a musíme je pořizovat ve formě nezávislé na vývoji nástrojů na jejich interpretaci.
To, že jsou následující úvahy oprávněné, potvrzuje i to, že firma ADOBE reagovala na kritiku neprůhlednosti PDF a nedávno přišla s formátem PDF/A, který je „otevřený“ a měl by být použitelný v archivaci.
Digitalizace historických dokumentů - VISK6
Všimněme si specifické oblasti – digitalizace historických dokumentů, která se v České republice rozvinula na velmi vysoké úrovni hlavně díky projektu ministerstva kultury VISK6 [4]. Tento projekt digitalizace vzácných písemných památek pokračuje i v příštím roce a umožňuje institucím za přijatelných podmínek bezpečně digitalizovat na velmi vysoké technické úrovni. Jako každoročně je možnost se přihlásit k účasti hned na počátku ledna.
Digitalizace v tomto projektu je snadno přístupná a umožňuje vyvarovat se chyb při tvorbě dat určených k dlouhodobému uchování. Projekt těží z výsledků dřívějšího vývoje, řešících problematiku dlouhodobého uchování dat a eliminuje účastníkům výše uvedená rizika při péči o digitální data. Národní knihovna na sebe v tomto projektu bere závažnou odpovědnost za bezpečné uchování vznikajících dat do budoucnosti, za jejich dlouhodobou použitelnost i za jejich migraci na aktuální média. Této možnosti využily už desítky knihoven, muzeí a archivů.
Před následujícími úvahami stojí zato navštívit stránky http://www.memoria.cz/ [5], na nichž jsou zpřístupněny vybrané perly mezi digitalizovanými rukopisy, mimo jiné i populární, nedávno získaný fragment Dalimilovy kroniky. Lze odtud také navštívit Manuscriptorium – digitální knihovnu spojující katalog s dosud digitalizovaným fondem, včetně náhledů do rukopisů. Maximální kvalita určená pro internet je zpřístupněna v knihovnách, muzeích a dalších institucích. Manuscriptorium je klíčem i bránou do reálné digitální knihovny obsahující nyní více než 1700 významných rukopisů, starých tisků a map.
Jak vnímat a jak se dívat na tento fond ? Je nutné přijmout, že digitální dokument není náhradou originálu, je novým dokumentem. V mnohých vlastnostech je chudší než originál, v mnohých vlastnostech je zcela nový. Jaká je vlastně role digitální podoby originálu? Činnost digitalizačního pracoviště lze přirovnat k činnosti písařů opisujících originály ve středověku. I tyto opisy vznikaly na základě společenské objednávky, stejně jako nyní. Vznikaly proto, aby zprostředkovaly a šířily informační obsah originálu, aby opakovaně zpřístupnily původní sdělení.
Nakládání s originálem a opisem bylo v podstatě zcela stejné, stejně jako byly podobné fyzické vlastnosti opisu. Při současné digitálním „opisování" je digitální „opis“ určen k úplně jinému způsobu využívání než originál – obvykle k prezentaci na obrazovce počítače. Program digitalizace rukopisů a starých tisků VISK6 má blízko činnosti opisovačů v tom, že si klade si za cíl zpřístupnění originálů. Navíc digitalizace napomáhá zachování originálů tím, že se omezuje jejich používání.
Je nutno si plně uvědomit, že vznikající nové dokumenty si kladou za cíl (ve smyslu definice) umožnit uživateli „fyziologické vjemy nahrazující vnímání originálu“. Jinak řečeno, zaznamenává se nikoli originál, ale pohled na originál. Nelze přehlédnout statičnost vnímání digitalizovaného obrazu. Digitalizací zachováváme jeden konkrétní pohled na originál při konkrétním nasvícení a konkrétním rozevření knihy. U digitálního obrazu se nejde podívat na originál trochu jinak. Pohled na dokument je definitivní, pokud ovšem nepřipouštíme novou digitalizaci. Jenže v Manuscriptoriu jsou obrazy rukopisů, které jsou v originále již nedosažitelné. Z této zkušenosti a odpovědnosti pak plynou požadavky na snímání v projektu VISK6.
Samotný fakt, že snímání obvykle nelze snadno opakovat, vede k využívání špičkové techniky. Kvalitu obrazu nesmí určovat nebo limitovat dostupná technika, kritériem je vždy snaha o zaznamenání skutečně dobrého pohledu na originál. Rozpoznatelné musí být všechny detaily, které tvůrce originálu úmyslně zaznamenal a vytvořil. Tyto obrazy jsou pak zdrojem pro kvalitní tisky, ale také pro obrazy určené pro Internet, které jsou optimalizovány tak, aby byly prakticky použitelné při současných možnostech zpřístupnění. Obrazy pro Internet lze kdykoli v budoucnu znovu odvodit z původních obrazů. Nikdy by však již neměla vzniknout potřeba originály znovu fotografovat.
Vznik digitálního dokumentu
Všimněme si dalších podobností s knihou. Kniha má obal s názvem a autorem, má vazbu, která drží listy pospolu ve správném pořadí. V knize jsou významnější stránky s obsahem, tiráží, nadpisy kapitol. Totéž potřebuje digitální dokument, pokud se nespokojíte s hromadou anonymních obrazů. Pro sdílení digitálních dokumentů je dodržování formy nezbytné, stejně jako očekáváme obvyklou formu knihy. Tvorba „vazby“ digitálního dokumentu je proto stejně důležitá jako tvorba obrazů. Jedno bez druhého nemůže vést ke vzniku digitálního dokumentu.
Elektronickou vazbu tvoří texty v dohodnuté standardizované formě, která nese podobné informace jaké jsou v katalogizačních záznamech (dříve na kartičkách) o knihách. Navíc musí být k dispozici informace o struktuře knihy, o vztazích obrazů – pořadí a navigační informace mezi obrazy a podrobnějšími popisy.
Zatímco fyzická forma knihy se vyvíjela a stabilizovala staletí, forma elektronického dokumentu se vyvíjí nejvýše deset let. Koncepce spojená s VISK6 ale promyšleně těží z dosavadních zkušeností, navazuje na související nekomerční evropské projekty a učí se z historie.
Manuscriptorium je digitální knihovna
Vznik Manuscriptoria mimo jiné umožnila shoda mnoha institucí, že budou používat podobné postupy při tvorbě elektronické vazby. Používají se především výsledky evropského projektu MASTER. Zjednodušeně řečeno, k obrazům se vytvářejí textové soubory se strukturou XML, popisující originální dokumenty a vazbu na obrazy.
Tato metodika splňuje bezezbytku požadavek naprosté nezávislosti na konkrétním softwaru a je tedy dokonale nadčasová.
Podpora projektu digitalizace z Národní knihovny ČR vedla také ke shodě v metodice tvorby těchto popisů. To neznamená pevné a povinné struktury popisu a tabulky, naopak je zachována značná volnost v podrobnějším popisu. Může vzniknout nezávislý a v zásadě i úplně odlišný popis od různých badatelů k témuž rukopisu. Společným jmenovatelem jsou jen faktické identifikační informace, informace o historii a původu dokumentu a informace o jeho fyzických vlastnostech.
Teprve s tímto popisem vzniká elektronický dokument, který je obecně použitelný. Díky využití XML a veřejné deklaraci formy uložených dat jde o dokumenty skutečně nezávislé na dalším vývoji techniky a programů. Z takového dokumentu lze stejně snadno vytvořit dokumenty určené pro zveřejnění na internetu nebo třeba na CD-ROM. Je potěšitelné, že obecně použitelné nástroje podporující tuto koncepci nakládání s daty se rozšiřují a využívání XML se stává standardem.
Digitální dokumenty mohou být různé obsahem a stejné ve formě, podobně jako knihy. Podobnost s knihou a knihovnou jde ještě dál. Knihu/digitální dokument lze využívat jako samostatný informační objekt. Více knih (objektů) potřebuje knihovnu, která je také jejich fyzickým úložištěm. Knihovna potřebuje depozitář a potřebuje nástroje pro nalezení požadované knihy i systém, jak knihu evidovat, půjčit, zpřístupnit. To vše je řešeno také v Manuscriptoriu, jen regály jsou nahrazeny diskovým polem a bezpečnými úložišti dat a knihovnice vyhledávající a podávající knihu je zastoupena rešeršním a prezentačním nástrojem.
Podobnost je i v tom, že knihovnice může odejít do důchodu a knihy se nezmění, stejně jako lze nad takto koncipovanou digitální knihovnou nasadit jiné nástroje, jiné systémy a přesto data stejně jako knihy zůstávají.
Slova "Manuscriptorium je digitální knihovna" tak nejsou metaforou, jsou skutečností.
Jak do digitální knihovny
Manuscriptorium je skutečností prakticky prověřenou již dvěmi lety provozu. Volný vstup je na adrese www.manuscriptorium.com [6]. Nikdy nebudete v této knihovně sami. Počet současných návštěvníků se pohybuje v desítkách a přístupy nekončí ani v noci, protože významná část přístupů je z celého světa. Volně přístupné obrazové informace jsou v současnosti pouze náhledy. Deset vybraný dokumentů lze prohlédnout v celé kráse na související adrese www.memoria.cz [7]. Celý fond lze prohlížet ve více než stovce knihoven, muzeí a archivů. Volný přístup mají instituce registrované na ministerstvu kultury a také všechny instituce (i zahraniční), jejichž data jsou součástí Manuscriptoria. Dosavadní spolupráce firmy AiP Beroun s Národní knihovnou přechází nyní na nové principy, což je základem dalšího intenzivního vývoje a spolupráce na osvědčených základech. Mezinárodní spolupráce na Manuscriptoriu a také již dlouhodobě propagované i prakticky aplikované principy mají své zúročení. Přispěly významně k získání ceny UNESCO Jikji, která byla Národní knihovně udělena v letošním roce [8].
Poznámka: Příspěvek byl napsán pro časopis A2.