Konference CNZ 2010
Ve čtvrtek 30. září 2010 proběhl v prostorách Národního archivu [4] v Praze již pátý ročník odborné konference CNZ, která si svým názvem opět položila otázku „Co po nás zbude?“. Hlavními tématy konference byly jako obvykle elektronické dokumenty, datové schránky, zabezpečení dat a legislativa a především otázky dlouhodobého uchovávání elektronických dokumentů. Podtitul letošního ročníku zněl „eArchivace na výsluní“.
Národní archiv v Praze (foto: CNZ)
Konferenci zahájil předseda sdružení CNZ [6] Jan Heisler, několik slov si připravila také zástupkyně ředitelky Národního archivu Zdeňka Kokošková. Po nezbytném úvodu a představení programu pak J. Heisler přivítal letošního klíčového řečníka, kterým byl Alfredo Esposito z italské společnosti InfoCert [7].
Zahájení konference CNZ 2010
Alfredo Esposito a projekt SPOCS
Hlavním tématem přednášky A. Esposita byl evropský projekt SPOCS (Simple Procedures Online for Cross – Border Services [9]), který se zaměřuje na pravidla a metodiku používání elektronických dokumentů v přeshraniční komunikaci v rámci EU. Klíčovým prvkem tohoto projektu je zajištění interoperability, tedy schopnosti různých států, subjektů a systémů vzájemně spolupracovat a poskytovat si informace a služby.
O naplnění těchto cílů se pokusila již směrnice Evropské unie Service Directive [10] z prosince roku 2006, kterou ale ani po tříleté implementační periodě nedokázaly všechny státy EU zdárně začlenit do své legislativy. Na základě směrnice byla nicméně ve všech členských státech zřízena alespoň tzv. Jednotná kontaktní místa [11], která se snaží maximálně usnadnit získávání informací a vyřizování formalit spojených s podnikáním v rámci EU. Pro Českou republiku je tímto jednotným kontaktním místem portál BusinessInfo.cz [12].
Vedle zmiňované „Směrnice o službách“ se otázkám evropské interoperability věnuje právě projekt SPOCS [9], který se snaží zlepšit situaci v rámci současné evropské digitální agendy a zaměřuje se na důležité prvky, jako např. standardy, bezpečnost, transparentnost, jednotný digitální trh atd. Cílem těchto snah není nějaká vynucená integrace (tj. vytvoření jediného systému, standardu nebo subjektu), ale již zmiňovaná interoperabilita, která umožní snadnou, rychlou a efektivní spolupráci různých subjektů.
Elektronické dokumenty to nemají v rámci Evropské unie zrovna jednoduché. Kromě jazykových rozdílů zde máme například různé datové formáty, odlišné právní systémy, nejednotné formáty autentizace (např. e-podpisů), různý přístup k dlouhodobému uchovávání atd. Projekt SPOCS pochopitelně nemůže příliš ovlivnit politickou situaci či legislativu, ale může alespoň usnadnit výměnu e-dokumentů s pomocí standardů a obecných pravidel.
Klíčový řečník A. Esposito (foto: CNZ)
Výstupy projektu se dělí do tzv. „pracovních balíčků“ (work packages), které se zaměřují na různá témata – například WP2 se věnuje e-dokumentům, přičemž se snaží o zajištění vhodné specifikace a metodologie, která by co nejvíce usnadnila identifikaci a autentizaci dokumentů, harmonizaci dat, využití standardů atd.
Navrhovaným řešením těchto problémů by měl být „kontejner“ s pracovním názvem OCD neboli Omnifarious Container for eDocuments. Ten bude obsahovat původní dokument v původním stavu, ale „zabalí“ ho do standardizovaného formátu s doplněním důležitých metadat a autentizačních prvků (e-podpisy, sledování změn atd.). Fyzická struktura „kontejneru“ by měla vycházet z formátů .pdf a .zip.
Plenární část
Po úvodní přednášce A. Esposita přišla na řadu tzv. plenární část konference, ve které zazněly další čtyři přednášky a prezentace. Týkaly se nových trendů v oblasti ukládání e-dokumentů, práce s datovými schránkami a zazněly také zkušenosti z Rakouska a Slovenska.
Plenární část zahájil Miroslav Širl (ze sdružení CNZ [14]) s prezentací „Trendy v oblasti ukládání elektronických dokumentů“. Díky zavedení datových schránek u nás elektronické dokumenty zažívají poměrně velkou expanzi. V rámci ISDS (Informační systém datových schránek [15]) už bylo doručeno cca 20 milionů datových zpráv, přičemž každá obsahuje průměrně tři dokumenty a každý dokument obsahuje průměrně pět stránek. Největší skupinu v rámci této datové komunikace tvoří justice (cca 40 %).
Otázkou ale zůstává, co s těmito dokumenty bude dál. U řady organizací počet e-dokumentů překročil kritické množství a začínají se objevovat problémy, jak s nimi dále naložit. Kritickým místem je tedy již mnohokráte zmiňované důvěryhodné dlouhodobé uložení. V každodenní praxi se navíc stále používají především papírové ekvivalenty.
V této souvislosti je také nutné zdůraznit, že drtivá většina papírových „výtisků“ není autorizovaná, a tedy tak docela platná. K datu 31. 8. 2010 bylo provedeno pouze 614 635 autorizovaných konverzí z elektronické do listinné podoby a 2 729 632 konverzí z listinné do elektronické podoby, což v celkovém objemu dokumentů dělá pouze cca 1 %. Ačkoliv by tedy používání elektronických dokumentů mělo být přínosem, zatím tomu tak docela není.
Krátká přestávka před plenární částí konference
O zahraniční zkušenosti se podělila Ann Keenová ze společnosti Tessella [17], která ve svém příspěvku hovořila o současném stavu uchovávání digitálních informací, o aktivitách své společnosti (kde působí na pozici Archiving Account Director) a v krátkosti také zmínila případovou studii řešení archivace e-dokumentů v Rakouském státním archivu [18], na kterém spolupracovali se společností Siemens [19].
Současnou situaci v oblasti digitální archivace se pokusil zmapovat výzkum „Planets Market Research“, který proběhl v roce 2009, a kterého se zúčastnilo více než 200 respondentů z celého světa (knihovny, archivy, IT společnosti a další instituce). Výsledky byly poměrně rozpačité – povědomí o dlouhodobém uchovávání elektronických dokumentů je sice dostatečné, ale vlastní zapojení už pokulhává. Digitální archivace je často vnímána jen jako povinnost (bez viditelných přínosů), nebo jako luxus (kvůli nákladům).
Rizika nevhodné archivační strategie mohou být ale značná - mohou zahrnovat selhání hardwaru, nemožnost vyhledání potřebných informací nebo nemožnost jejich přečtení (ať už z důvodu poškození či nekompatibility). Řešením společnosti Tessella [20] je koncept „Safety Deposit Box“, který je ve vývoji od roku 2003 a je založený na referenčním modelu OAIS (Open Archival Information System). Díky své robustní a flexibilní architektuře umožňuje dlouhodobé, spolehlivé a aktivní uchovávání informací. Podrobnosti o projektu jsou také na dedikovaném webu www.digital-preservation.com [21].
O své zkušenosti se s námi podělila také ředitelka odboru registratur a správy dokumentů Ministerstva vnitra SR [22] Mária Mrižová. Hovořila především o současné legislativě na Slovensku a o povinnostech, které z ní vyplývají. Správci elektronických spisoven musí vést řádnou evidenci záznamů, musí zabezpečit trvanlivost záznamů a jejich bezpečné a účelné uložení a musí také zařídit dostatečné personální zajištění. V závěrečných fázích života dokumentů pak musí zabezpečit jejich řádné vyřazování, případně přesun do archivu.
Na Slovensku se v současné době připravuje také novela zákona o archivech a registraturách, která sjednotí a rozšíří dosavadní legislativu a přidá i další povinnosti, např. nutnost zabezpečit elektronický dokument elektronickým podpisem a časovým razítkem. Návrh novely také definuje některé nové pojmy a řeší i vybudování a správu Národního digitálního archivu. Novela také zavazuje Ministerstvo vnitra vydat dva vykonávací předpisy: předpis o výkonu správy spisoven orgánů veřejné správy a předpis o standardech pro elektronické informační systémy.
Poslední prezentaci dopolední části konference si připravil Vladimír Střálka, Country Manager společnosti Adobe [23]. Ve své prezentaci se vrátil tématu datových schránek (a e-dokumentů obecně) a hovořil o jejich zpracování z pohledu uživatelů. Vzhledem k tomu, že současným standardem datových zpráv a „kontejnerů“ e-dokumentů je formát PDF, univerzálním klientem pro všechny procesní úkony je program Adobe Reader [24].
Firemní platforma pro řízení všech relevantních úloh a procesů (jako jsou tvorba, čtení, tisk, konverze, schvalování, e-podpisy, časová razítka atd.) se nazývá Adobe LiveCycle [25]. Jedná se o integrované řešení, které spojuje interaktivní aplikační služby, řízení procesů a dokumentové služby do jediného přehledného a efektivního celku. Sílu této platformy V. Střálka demonstroval na příkladu nasazení řešení LiveCycle na Ministerstvu spravedlnosti ČR [26], kde řešení Adobe bez problémů funguje i při převodu desítek tisíc dokumentů denně.
Oběd byl tentokrát ve znamení Magdaleny Dobromily Rettigové
Odpolední přednáškové bloky
Po přestávce na oběd začala odpolední série přednášek. Přednášky byly rozděleny do čtyř bloků, které probíhaly po dvojicích paralelně na dvou místech. Program jednotlivých modulů byl k dispozici předem i přímo na místě, každý si tedy mohl v předstihu vybrat téma, které ho zajímalo.
Blok A
První přednášku prvního bloku si připravil Milan Selan, vedoucí informačního oddělení sekretariátu vlády Slovinské republiky [29] a ředitel sdružení Media.doc [30]. Ve svém příspěvku se věnoval vývoji archivnictví ve Slovinsku od klasických archivů až po současné digitální repozitáře. Zajímavou informací bylo, že slovinský generální sekretariát již v roce 2001 rozhodl, že všechna jednání vlády a vládních výborů budou výhradně „bezpapírová“, tj. elektronická. Od roku 2002 jsou také digitalizovány všechny vládní papírové dokumenty a od roku 2003 se na rozhodnutích vlády používají elektronické podpisy. V současnosti probíhají přípravy na vytvoření nového digitálního archivu.
Oskar Macek z Ministerstva vnitra ČR [31] se ve svém příspěvku „Archivní legislativa v kontextu reálné praxe“ zaměřil především na optimalizaci národního standardu pro elektronické systémy spisové služby. Standard je totiž v současné době příliš přísný, povinné požadavky na vedení spisové služby orgánů veřejné moci jsou nad rámec daný zákony ČR, což prodražuje nákupy systémů a jejich provoz. V souladu se současným budovaným Národním digitálním archivem byly definovány minimální požadavky pro zajištění bezpečného uložení e-dokumentů a požadavky nad touto hranicí budou deklarovány jen jako nepovinné. Finanční úspory by se měly pohybovat v řádu stovek milionů korun.
První blok uzavřel obchodní ředitel společnosti Software602 [32] Pavel Nemrava s prezentací zaměřenou na autorizovanou konverzi elektronických dokumentů. Prezentace mapovala situaci za poslední rok (ať už se jednalo o konverze na žádost či z moci úřední) a byly také prezentovány některé statistiky. Například Praha je nad průměrem v konverzi elektronických dokumentů do papírových, zatímco Středočeský kraj je leaderem v konverzi papírových dokumentů do elektronické podoby. V závěru P. Nemrava ještě pohovořil o pozici společnosti Software602 [32] na trhu a prezentaci uzavřel mottem: „Naučili jsme lidi na počítači psát, naučíme je na počítači se i podepsat!“
Blok B
O zkušenostech s přijímáním a odesíláním elektronických dokumentů prostřednictvím ISDS se s námi podělil také Jan Jelínek z Krajského úřadu Ústeckého kraje [33]. Hovořil o informačním systému datových schránek, o spisových a archivních službách a také o digitalizaci a konverzi dokumentů. Zaměřil se také na ukládání elektronických dokumentů na úřadě v souvislosti s přípravou a realizací projektů tzv. technologických center krajů, kde je na problematiku digitalizace a ukládání elektronických dokumentů kladen velký důraz.
Josef Neumann ze společnosti ICZ [34] následně představil nový koncept pro digitální archivy. Existuje celá řada různých druhů vyhledávání – od nejjednoduššího hledání s pomocí klíčových slov, přes strukturované či federativní vyhledávání, až po tzv. „meaning-based computing“ neboli zpracování informací na základě jejich významu. Ostatně hodnota informací není jen v jejich vyhledání, ale především v jejich zpracování a využití.
Zástupcem „meaning-based computing“ je architektura Autonomy [35], která propojuje řadu prvků jako automatické značkování, textovou analýzu, přepis mluveného slova, analýzu obrazu atd. a ve výsledku tak vzniká „konceptuální index služeb pokročilého porozumění a zpracování obsahu“. Klíčovou technologií je IDOL, Inteligent Data Operation Layer, který automatizuje zpracování a analýzu všech informačních zdrojů, definuje vzájemné vztahy a významy, rozumí více než 1 000 formátům a podporuje všechny světové jazyky. Není tedy divu, že na Autonomy běží největší systémy na světě (Ministerstvo obrany USA [36], BBC [37], Bloomberg [38], NASA [39], Nomura [40] atd.).
Druhý blok konference uzavřela přednáška Rudolfa Hrušky ze společnosti IBM [41] s názvem „Informační HW infrastruktura pro dlouhodobé digitální ukládání“. Přednášející nejprve krátce pohovořil obecně o archivech, jejich vlastnostech a jejich infrastruktuře (včetně známého referenčního modelu OAIS) a ve druhé polovině prezentace se zaměřil na produkt IBM Information Archive. Jedná se o univerzální, zabezpečené a škálovatelné úložiště strukturovaných i nestrukturovaných informací, které kombinuje disková pole a páskové technologie pro zajištění rychlého přístupu i vysoké ochrany před možným poškozením.
Blok C
Třetí blok přednášek zahájili Ludvík Navrátil ze společnosti Oracle [42] a Marcela Rágulová ze společnosti Vodafone [43] přednáškou & případovou studií implementace nového systému. Vzhledem k tomu, že původní úložiště už nedostačovalo, rozhodla se společnost Vodafone implementovat nový systém pro ukládání elektronických dokumentů, „eArchiv“. Prezentace se tedy věnovala požadavkům na nový systém, technickému návrhu řešení od firmy Oracle a také výsledkům testování výkonu po dokončení implementace.
O zkušenostech České správy sociálního zabezpečení [44] se systémy pro správu dokumentů (DMS) hovořily ředitelka odboru koncepcí a systémové strategie ČSSZ [44] Radka Poláková a vedoucí projektu DMS Zuzana Hájková. Elektronický archiv vzniká ve třech etapách: hromadou digitalizací, průběžnou digitalizací přírůstků a příjmem dokumentů v elektronické podobě. Systém pro správu dokumentů by tedy měl umožnit rychlé a snadné pořizování dokumentů, denní práci s dokumenty (prohlížení, aktualizaci, sdílení) a trvalou archivaci v kombinaci s vysokou mírou zabezpečení dat. V závěru prezentace zazněl i praktický příklad vybudování e-archivu na MSSZ Brno (projekt DIGI).
Závěrečnou prezentaci tohoto bloku si připravil Jiří Bříza ze společnosti aplis.cz [45], který se věnoval práci s dokumenty a spisy na konci jejich životního cyklu. Digitální písemnosti pochopitelně nejen vznikají a jsou aktivně využívány v rámci různých systémů, spisových služeb a podobně, ale po nějaké době dospějí k závěru svého životního cyklu. V této chvíli se může rozběhnout buď skartační řízení, nebo proces archivace; přičemž v obou případech je velikým pomocníkem systém DMS, který sleduje správnost celého procesu (od posouzení dokumentu, přes zpracování protokolu, až po samotnou skartaci či archivaci). Řešení společnosti aplis.cz se nazývá abcSuite (aplis business communication Suite).
Blok D
Poslední blok konference zahájila prezentace Horymíra Šímy z Corpus Solutions [46], jejíž tématem byla ochrana proti úniku citlivých informací. Ochranu informací a dokumentů ve firemním prostředí řeší zpravidla systémy CMS (systémy pro správu obsahu) a DMS, nicméně i přesto se dnes a denně setkáváme s únikem dat a zneužitím informací. Důvodů je celá řada – např. nedostatečná infrastruktura či vnější útok, ale nejčastějším zdrojem úniku dat jsou samotní uživatelé. Mezi příčiny lze řadit například absenci politik zacházení s daty, nedostatečné povědomí o tématu či nedostatečné (a někdy i chybějící) technologie. Řešením je tedy vypracování pravidel, provedení pilotního měření a implementace vhodné technologie zajišťující ochranu dat v rámci celého procesu.
Vladimíra Hloušková ze společnosti Sefira [47] si připravila příspěvek na téma „Používání časových razítek v praxi“. V krátkosti pohovořila o legislativě a standardech a poté se již zaměřila na aktuální problémy. Při používání e-dokumentů totiž často vyvstává otázka, kdy a jak elektronické podpisy a především časová razítka používat. V současnosti totiž chybí všeobecné povědomí, neexistuje jeden koordinační orgán odpovědný za vývoj legislativy a k dispozici není ani ucelený soubor metodických pomůcek. Problémy způsobuje také přechod z kryptografického algoritmu SHA1 na SHA2 (opět bez metodické či technologické koordinace) a problémem je i validita dokumentů v případě neplatných certifikátů (tj. bez časového razítka). Za současných technologických a legislativních podmínek například nelze prokázat platnost dokumentu zpětně. Naštěstí existují některé uživatelská řešení jako např. rozšíření procesů v rámci CMS či implementace do spisové služby.
S poslední prezentací konference vystoupil Tomáš Dvořák z Archivu hlavního města Prahy [48]. Nejprve v krátkosti pohovořil o pravomocích archivu a jeho původcích, kam spadá např. Magistrát hl. m. Prahy [49], Městská policie [50], úřady městských částí, příspěvkové organizace, akciové společnosti, základní i střední školy – zkrátka různé subjekty zřízené hlavním městem nebo nějakou městskou částí. Co se týče digitálních dokumentů, archiv spravuje 172 původců celkem z cca 800, kteří mají ze zákona zřízenou datovou schránku, plus řadu dalších, kteří ji mají zřízenou na žádost.
Archiv také v současné době řeší projektový záměr vybudování digitálního archivu. V roce 2008 byla schválena výstavba objektu Chodovec II, ve kterém budou datové centrum hl. města Prahy, centrum digitalizace, digitální archiv a správní archiv Magistrátu hl. města Prahy. Stavba by měla začít v roce 2011 a dokončení se plánuje na rok 2013. V závěru prezentace zmínil T. Dvořák ještě studii proveditelnosti od společnosti Relsie [51] a ze studie vyplývající doporučení k reorganizaci archivu.
Budova Archivu hlavního města Prahy
Závěrem
Jubilejní pátý ročník konference CNZ byl plný zajímavých přednášek, které představily aktuální trendy v oblasti uchovávání digitálních informací. Návštěvníků bylo snad ještě více než v minulém roce [53] a zejména v dopolední části (tj. před rozdělením do paralelních sekcí) byl hlavní sál obsazený do posledního místa.
Ačkoliv se na otázku „Co po nás zbude?“ nedá ještě s určitostí odpovědět, můžeme se zatím alespoň potěšit tím, že leccos zajímavého zbylo alespoň po stejnojmenné konferenci. Na webových stránkách [54] jsou totiž jednotlivé prezentace a několik fotografií, takže si můžeme alespoň trochu zkrátit čekání na konferenci CNZ 2011.
Slunečnice jako symbol "eArchivace na výsluní"