Konference CNZ 2008
V úterý 23. září 2008 se v budově Národního archivu v Praze konala konference se zajímavým názvem Co po nás zbude? [4] Pořadatelé (ze stejnojmenného sdružení) touto řečnickou otázkou naráželi zejména na problematiku ukládání a uchovávání elektronických dokumentů a dlužno dodat, že prostory Národního archivu [5] byly pro toto téma ideální.
Národní archiv
Úvodní přednáška
Vzácným hostem a hlavním řečníkem byl Jason R. Baron z Národního archivu USA [7], kde již od roku 2000 působí na pozici ředitele Litigation Office, tedy právního oddělení zabývajícího se různými spory a žalobami. Tato práce ho sice jako právníka těší, ale zároveň jsou takové procesy často dosti komplikované, zejména pokud se opírají o dokumenty, které by měly být archivované, ale nejsou.
Ve svém příspěvku se věnoval převážně archivování e-mailů, protože právě elektronická pošta se v posledních letech stala primárním komunikačním prostředkem (i ve srovnání s klasickou poštou či telefonem). Je ovšem otázka, jak k archivování e-mailů a dalších digitálních dokumentů přistupovat. Ostatně, Národní archiv v USA má za povinnost uchovávat oficiální korespondenci – kam se řadí například i e-maily úřadujících prezidentů.
Jason R. Baron ve své přednášce zmínil celou řadu zajímavých případů, které se této oblasti týkaly. Jeden z prvních sporů propukl již v roce 1989 v závěru volebního období prezidenta Reagana. V té době také vznikla potřeba efektivního ukládání těchto záznamů, samozřejmě s ohledem na následné vyhledávání (tagování, metadata apod.). Další zajímavá kauza byla z roku 2000, kdy se kvůli technické chybě ztratily všechny e-maily Bílého domu od odesílatelů se jménem začínajícím na písmeno „D“. Následovaly zdlouhavé a nákladné restaurační práce, a do popředí se tak dostaly otázky týkající se kontroly zabezpečení.
Od roku 2006 operuje americká legislativa s termínem ESI (Electronically Stored Information), který zahrnuje různorodé digitální zdroje od e-mailů přes CD, DVD a harddisky až po sociální sítě, blogy nebo textové zprávy. Je sice pozitivní, že se i tyto oblasti zkoumají, ale problémem je zejména selekce – tedy co bychom měli z toho nepřeberného množství informací uchovat a co naopak nikoliv. S tím také souvisí otázka, kdo bude selekci provádět, jak se budou informace zpracovávat, jak v nich smysluplně vyhledávat apod.
Ideálním řešením budoucnosti by tak pravděpodobně byla zcela automatická archivace, která by vyloučila případné lidské chyby (= smazání něčeho důležitého). Současně by ale bylo nutné, aby systém neukládal úplně všechno, ale opravdu jen věci relevantní. K tomuto cíli ale zbývá ještě dlouhá cesta. Do té doby musíme žít s tím, že ukládání i vyhledávání je složité a v řadě případů problematické (například nejen zbytečně vyhledané nerelevantní výsledky, ale v horším případě výsledky relevantní, ale systémem nevyhledané).
Jason R. Baron z Národního archivu USA
Úvodní přednáška Jasona R. Barona samozřejmě nebyla jediným bodem programu. Bylo připraveno dalších 18 prezentací (ve třech tematických blocích), které byly z časových důvodů rozdělené do dvou paralelních sekcí. Nebylo tedy možné osobně vidět vše, účastníci však obdrželi CD s prezentacemi, mohli se tedy k některým příspěvkům znovu vrátit. Prezentace jsou také k dispozici na webových stránkách konference [4].
Blok A: Legislativa a další vnější vlivy na správu elektronických dokumentů u původců
Jiří Bernas z Národního archivu [5] ve své prezentaci hovořil zejména o plánech Národního digitálního archivu. Ten by měl v budoucnu digitalizovat staré tisky, vzácné listiny, i dokumenty státní správy. Technologický projekt (k nahlédnutí na adrese http://www.nacr.cz/zpravy/projekt_nda.aspx [9]) byl dokončen v březnu 2008; nyní se řeší veřejné zakázky, financování pomocí strukturální fondů EU, a brzy už doufejme začne samotná výstavba a další etapy realizace. Ostrý provoz by měl podle harmonogramu odstartovat 1. 1. 2012.
Ing. Pavel Pačes (ICZ [10]) se následně věnoval archivaci digitálních dokumentů, kam patří jak dokumenty primárně digitální, tak i digitalizované (například z papírové podoby). Zaměřil se také na rozdíly mezi digitálním archivem a digitální knihovnou (důraz na dlouhodobost uložení x zpřístupnění uživatelům). Zmínil i termín digitální spisovna (tzv. meziarchiv, který dokumenty ověřuje a následně je buď skartuje nebo posílá do archivu). Pohovořil také o referenčním modelu OAIS (Open Archival Information Systém [11]).
O archivech v kontextu Evropské digitální knihovny [12] hovořila Mgr. Romana Křížová ze společnosti Cross Czech [13]. EDL (nebo také Europeana [14]) je rozsáhlým projektem kombinující digitální knihovnu, muzeum i archiv. Oficiální představení je naplánováno na listopad 2008. Druhá část prezentace byla zaměřena na strukturální fondy a komunitární programy Evropské unie, zejména na jejich charakteristiku a vzájemné odlišnosti (strukturální fondy jsou obvykle vázané na region, např. ČR, zatímco komunitární programy jsou založené na mezinárodní partnerské spolupráci, jejich dopad je zpravidla celoevropský).
Dr. František Steiner z Ministerstva spravedlnosti [15] se pro změnu zaměřil na oblast elektronické justice. Tou je podle něj míněno využití informačních technologií v prostředí justice, především pak zavedení elektronické formy komunikace. Primárním cílem je pak zvýšení celkové efektivity systému justice (mezi další cíle patří kvalitnější informační servis, zvýšení bezpečnosti, snížení procesních nákladů apod.). Z dosud realizovaných projektů jmenujme např. e-podatelny či insolvenční rejstřík [16].
Dalším řečníkem byl Ing. Oskar Macek (Ministerstvo vnitra [17]), který se ve své prezentaci věnoval dopadům novely zákona o archivnictví a spisové službě na zpracování a ukládání dokumentů v elektronické podobě. Novela například sjednocuje základní formáty (PDF/A-1a,PNG a TIFF(r.6)); věnuje se i autentizaci elektronických dokumentů. Jedním z hlavních cílů je úplná implementace informačního systému GINIS [18].
Z Ministerstva vnitra [17] byl i dr. Ondřej Felix, poslední host této sekce, který hovořil zejména o datových schránkách a spisové službě. Přijetí zákona 300/2008 Sb. je podle Ondřeje Felixe revolucí, protože tento zákon přináší elektronické úkony, informační systém datových schránek a autorizovanou konverzi dokumentů. Mezi zmiňované úkony se řadí elektronické podání a doručení, datové schránky jsou úložištěm pro komunikaci s orgány veřejné moci, konverze je převod dokumentů z listinné formy do datové zprávy a naopak.
Hlavní přednáškový sál
Blok B: Správa dokumentů u původců
Tematický blok zahámila prezentace o důvěryhodném elektronickém spisu, kterou si připravil RNDr. Vladimír Střálka ze společnosti Adobe [20]. Klasický spis je v podstatě obálka, která obsahuje zaručené informace k danému případu; konkrétně se jedná o soubor složek s dokumenty a dalšími materiály. Spis tedy zaručuje pravost informací a má archivační a integrační roli. Také elektronický spis musí mít všechny tyto náležitosti, a nejedná se jen o elektronický dokument, ale opět o „obálku“, která propojuje různé typy souborů. Aktuální řešení od Adobe, které se stalo také standardem ISO (ISO 32000 [21]), nese název PDF 1.7.
Doc. Václav Ledvinka z Archivu Hlavního města Prahy [22] následně hovořil o spisové službě a dlouhodobém ukládání digitálních dokumentů. Jako příklad byl uveden pražský Magistrát [23], kde v letech 1994 až 2002 probíhala informatizace a elektronizace a od roku 2005 byla schválena řada dalších inovačních programů (jako např. e-Praha). Nicméně v sérii analýz a auditů z let 2007-2008 bylo zjištěno, že navzdory masivnímu nasazení informatiky je celý systém nepřehledný, neefektivní a nerentabilní (zejména pro jednotlivé uživatele). V současné době se tedy hledají taková řešení, která by měla tento nepříznivý stav co nejdříve zvrátit.
Jan Jiskra ze společnosti Sun [24] si připravil případovou studii Národní knihovny na Novém Zélandu [25], kde proběhl projekt digitálního archivu národního kulturního dědictví. Bylo kupříkladu zajímavé, že značná část softwaru byla založena na otevřeném zdrojovém kódu (open source). Protože knihovna kladla důraz i na „eko-zodpovědnost“, jako primární ukládací médium byla zvolena magnetická páska, protože má ve srovnání s diskovými poli mnohem delší životnost a nesrovnatelně nižší energetické náklady.
Ing. Jan Janota (AutoCont [26]) následně hovořil o současných IT technologiích a jejich použití v oblasti dlouhodobého ukládání dokumentů. Otázka totiž zní, jestli informační technologie dokážeme využít – máme servery a disky s obrovskými kapacitami, máme také software na míru téměř jakémukoliv řešení. Přesto se ale řada projektů nedaří podle představ. Jan Janota vidí tři příčiny tohoto stavu: konkurenci (na úrovní firem a technologií), ekonomiku (tedy finance) a „čas“. Současný svět totiž není zaměřen na uchovávání minulosti, ale současnou efektivitu.
Další prezentace se věnovala televiznímu archivu veřejné služby, který představil Ing. Milan Gazdík z České televize [27]. Projekt Digitalizace archivů a programových fondů (DAPF) byl zahájen v roce 2007. Jde o prioritu, protože kromě uchovávání nové digitální produkce je třeba digitalizovat i archiv stávající (hybridní prostředí je neefektivní, materiály pozvolna degradují stářím a manipulací). Nový archiv musí ale obsahovat i určitou „přidanou hodnotu“ (metadata, klíčové snímky, dokumenty atd.), což pochopitelně celý proces komplikuje. Nicméně při vhodně zvoleném postupu lze archiv pokládat za zdigitalizovaný již po konverzi cca 20 % položek.
Vladimír Váňa (IBM [28]) si na závěr této sekce připravil případovou studii z Muzea rozhlasového a televizního vysílání [29] v Chicagu (USA). Muzeum bylo založeno v roce 1987, shromažďuje analogové nahrávky programů již od roku 1930. Aby byli schopni spravovat a především zpřístupnit své archivy, rozhodli se pro rozsáhlý projekt digitalizace. Řešení bylo nakonec úspěšné – během prvních šesti měsíců zaznamenali cca 70 000 návštěv archivu.
Malý sál neboli kinosál
Blok C: Péče o uložené elektronické dokumenty
Mgr. Zdeněk Loebl uvedl tuto sekci pojednáním o důvěryhodných elektronických dokumentech, konkrétně o tom, co vlastně dělá dokument důvěryhodným. U klasického dokumentu to je kupříkladu vlastnoruční podpis, u digitální verze to je podpis elektronický. Nicméně s důvěryhodností se pojí i určité problémy. Lze konstatovat, že žádný důkaz není absolutní. Kombinace různých postupů sice zabezpečení zvyšuje, ale nabízí se pro změnu otázka, zda využívat skupinu několika nástrojů či preferovat jednotný standard. Na závěr si Zdeněk Loebl položil několik otázek týkajících se připravované legislativy, například zda není příliš radikální, zda je bezpečná a co se stane, pokud systém selže.
Ing. Richard Margala (Ardaco [31]) se na problematiku podíval z druhé strany – zaměřil se na důvěryhodnost papírových kopií elektronických dokumentů. Ty by pochopitelně měly být zabezpečené stejně jako dokumenty digitální. Toho lze dosáhnout několika způsoby, například použitím čárového kódu; ten ale neobsahuje dostatek údajů a dá se relativně snadno zneužít. Mnohem sofistikovanější řešení nabízí systém PDMark, což je speciální vodotisk tvořený čárkami, které mohou zakódovat až 40kB dat (obrázek, podpis, otisk prstu atd.)
Mezi přítomnými firmami nechyběl pochopitelně ani Microsoft [32]. Zastupoval ho Štěpán Bechynský, který se věnoval otevřenému datovému formátu ISO/IEC 29500 [33]. OOXML (neboli Office Open XML [34]) je formát, který dokáže „zazipovat“ do dokumentu různé dílčí prvky včetně grafiky či zvuku. Každý XML soubor nese jeden typ informace, s využitím krátkých názvů pro klíčové elementy se tak urychluje nahrávání a parsování (syntaktická analýza). Stranou nezůstávají ani možnosti zabezpečení (digitální podpisy).
O zabezpečení hovořil také Jiří Machotka ze společnosti Oracle [35]. Ochrana citlivých informací v dokumentech je důležitá oblast – zajímavé řešení nabízejí systémy Information Rights Management (IRM), které spravují přístupová práva k dokumentům. Zabezpečení se tak stává součástí přímo jednotlivých dokumentů a centrální server pak umožňuje tato práva jednoduše nastavit podle potřeby. Je tedy možné konkrétně definovat, co přesně může který uživatel s dokumentem dělat (číst, tisknout, ukládat, kopírovat atd.), a jednoduchou změnou v administraci je možné práva okamžitě změnit. Podobná ochrana se vztahuje i na e-maily.
Ing. Miroslav Kunt z Národního archivu [5] následně představil projekt celostátního archivního portálu, který bude součástí Národního digitálního archivu. Portál by měl fungovat jako rozhraní umožňující přístup k informacím a digitálním (a digitalizovaným) archiváliím. Měl by také umožnit správu dokumentů, vyhledávání v systémech jednotlivých archivů a zajistit autorizaci a řízení přístupových práv. Nezbytná je též i implementace mezinárodních archivních standardů ISAD(G), ISAAR(CPF) a standardů technických (OAI/PMH).
Poslední přednášku si připravil dr. Petr Budiš (ICA [36]), který hovořil o bezpečnostních atributech elektronických dokumentů. Cílem je zajistit, aby procesy, založené na elektronické komunikaci, byly minimálně stejně důvěryhodné a bezpečné jako běžné procesy, spojené s papírovou agendou. Ke splnění tohoto logického požadavku lze využít různé možnosti, například elektronické podpisy, časová razítka, certifikáty apod. Těmito nástroji je tedy možné zajistit integritu dat, průkaznost i důvěrnost obsahu. Otázkou nicméně zůstává dostupnost a čitelnost – to již závisí na formátech a standardech, které se však neustále mění.
V badatelně Národního archivu se výjimečně nebádalo
Závěrem
Jedním z posledních bodů konference byla panelová diskuze s názvem "Quo Vadis? – Kam kráčí dlouhodobé ukládání dokumentů?". V samém závěru se pak ještě řešily organizační záležitosti občanského sdružení Co po nás zbude [38], nechyběla ani tombola.
Vzhledem k celé řadě velmi zajímavých příspěvků (od velmi zajímavých hostů) mi nezbývá nic jiného než celou konferenci hodnotit velice kladně. Ostatně pro zájemce o zabezpečení, ukládání či archivování elektronických dokumentů se jednalo o jednu z mála příležitostí, jak se o této problematice něco dozvědět – podobně zaměřených akcí totiž opravdu mnoho není.
Pro úplnost ještě jednou zopakuji, že program konference (včetně anotací a prezentací ve formátu PDF) je k dispozici na webových stránkách [4]. V brzké době by se tam navíc měly objevit i nahrávky jednotlivých příspěvků.
Autorem fotografií je CNZ, o.s. (s výjimkou úvodní fotografie, která pochází z Národního archivu).