Konference Cultural Heritage on line a DPE Workshop
Ve dnech 14. až 16. prosince 2006 se v italské Florencii konala mezinárodní konference nazvaná Cultural Heritage on line [4] s podtitulem The challenge of accessibility and preservation. Organizována byla nadací Fondazione Rinascimento Digitale, sídlící ve Florencii, a MiBAC- Ministero per i Beni e le Attività Culturali (obdoba našeho ministerstva kultury).
Konference samotná měla za cíl mj. analyzovat, jakým způsobem informační a komunikační technologie mění architekturu znalostí v oblasti kulturního dědictví a přispět ke stanovení nových organizačních i právních doporučení. Byla vyzdvižena tato aktuální témata: znalostní management (knowledge management), ochrana digitálních objektů (digital preservation) a strategie přístupu (access strategies). Hlavními tématy konference tedy měly být:
- aplikace digitálních knihoven: trendy a výzvy
- ochrana digitálních objektů: technické a organizační problémy
- certifikovaná důvěryhodná úložiště (trusted repositories)
- archivy audiovizuálních dokumentů : produkce a ochrana
Konference byla slavnostně zahájena s téměř půlhodinovým, v Itálii obvyklým a akceptovaným zpožděním ve čtvrtek 14. prosince v Palazzo Vecchio. Úvodní část obsahovala několik zdvořilostních proslovů, mj. Paola Galluzziho (prezidenta nadace Fondazione Rinascimento Digitale), který mluvil o nových médiích a formách komunikace na internetu a o tom, jaké hrozby představuje roztříštěnost formátů právě pro všechny dokumenty na internetu dostupné. Antonia Pasqua Recchiaová popsala základy informační společnosti a představila některé aktivity Evropské komise v této oblasti, mj. iniciativu i2010 [5], doporučení EK z 24. srpna 2006 [1 [6]], projekty MINERVA [2 [7]], MICHAEL [3 [8]] aj. Mluvila i o některých italských projektech (ostatně jako mnoho následujících přednášejících), mj. o BDI – Biblioteca Digitale Italiana [4 [9]]. Přehled a přístup k italským digitalizovaným sbírkám je přes portál Internet Culturale [5 [10]].
V druhé čtvrteční sekci New scenarios, policies and programmes for the information society se jako hlavní řečník představila Patricia Mansonová s příspěvkem Digital libraries: European initiatives in digitisation and digital preservation [6 [11]]. Pověděla pro většinu přítomných již známé věci, např. o podpoře ochrany a přístupu k digitálním dokumentům ze strany EU, o potřebě nových metod a jak s tím vším je propojena „nová ekonomika“ EU. Prvními viditelnými projekty v návaznosti na i2010 jsou projekty CASPAR [7 [12]], The Digital Preservation Europe - DPE [8 [13]] a PLANETS [9 [14]], které odstartovaly v r. 2006. Zároveň uvedla, že již v r. 2007 by mělo dojít ze strany Evropské komise k některým změnám legislativy ohledně přístupu k digitálním dokumentům. Na ochranu digitálních dokumentů by se v rámci i2010 mělo v letech 2007-2008 vydat 102 milionů eur. Pirjo Hamariová ve svém příspěvku [10 [15]] prezentovala finské předsednictví EK, úspěchy a snahy na poli ochrany a zpřístupnění digitálních dokumentů. Stefano Rodota mluvil o právech duševního vlastnictví. Abid Abdelaziz ve svém příspěvku Preserving Heritage: a new paradigm [11 [16]] popsal aktivity organizace UNESCO na poli digitalizace a zpřístupňování digitálních dokumentů. Digitální dědictví se podle něj musí chránit stejnou měrou jako např. architektonické monumenty. S tím nám nezbývá než souhlasit. Andrea Scotti v příspěvku Standardisation bodies and EU participation [12 [17]] prezentoval svou studii o účasti a aktivitě evropských institucí v různých organizacích a aktivitách zabývajících se digitálními dokumenty a strategiemi s nimi souvisejícími. Musel bohužel na základě svých údajů a grafů konstatovat známý fakt, že země EU v porovnání s USA a zeměmi asijskými velkou aktivitu na tomto poli, až na čestné výjimky, neprojevují.
Luciana Durantiová ve své případové studii nazvané The InterPARES Framework for the development of policies, strategies and standards uvedla některé ze závěrů projektu InterPARES [13 [18]], jehož jedním z cílů bylo ustanovit standardy pro dlouhodobou ochranu elektronických dokumentů. Velmi zajímavé zásady, které tomuto cíli mají pomoci, jsou stanoveny zvlášť pro tvůrce (creators) a pro toho, kdo dokument nakonec ochraňuje (preservers) – více viz prezentace [14 [19]].
Poslední příspěvek dne a případovou studii v jednom pronesla Elizabeth S. Dulabahanová. Titul studie zněl Library of Congress programmes and strategies for long-term usability of digital collections [15 [20]]. Stručně představila již od r. 2000 běžící program NDIIPP [16 [21]], který má financování ve výši 100 milionů USD od americké vlády do r. 2010. V rámci tohoto programu existuje 10 grantů, včetně speciálních komisí k různým problémům, např. „copyrightová komise“ týkající se dokumentů na internetu. V půli r. 2007 by měla spatřit světlo světa první zpráva této komise [17 [22]]). V Kongresové knihovně se začalo nedávno testovat elektronické úložiště (e-deposit), zatím ovšem pro elektronické časopisy; v rámci něho je také prováděna digitalizace novin, výběrová archivace webu [17 [23]] a samozřejmě se podporují formáty a standardy, např. METS, PREMIS, MIX a mnoho dalších.
Páteční program konference začal sekcí pojmenovanou The technical challenges of digital preservation. První příspěvek měl Seamus Ross, hlavní řečník druhého dne konference. Jeho prezentace What the users want and what the users need [18 [24]] se věnoval tomu, co budou budoucí uživatelé digitálních knihoven chtít, zda to bude na něčem závislé a jak se taková předpověď dá udělat. Vyjmenoval několik souvisejících skutečností, které budou jejich chování a nároky určovat, mj. i důvěru v data, s čímž souvisí otázka důvěryhodných úložišť, která zajistí celistvost a autenticitu dokumentů i přístup k nim. A zopakoval známou skutečnost, že „uživatel neví co chce, dokud to nenajde“. Giovanni Bergamin [19 [25]] popsal zkušenosti své instituce (Biblioteca Nazionale Centrale ve Florencii) právě s budováním digitálního úložiště. Následující příspěvek [20 [26]] Borje Justrella pojednával o tom, jak předjímat celkové náklady na digitální úložiště v paměťových institucích (nákup, provoz atd.). Největší náklady si samozřejmě žádají, vedle samotného nákupu úložiště, platy zaměstnanců, a to v podstatě ve stejné výši jako nákup. S tím instituce musí počítat ve finančním výhledu, nelze počítat pouze s nákupem, tím to nekončí, právě naopak. Mariella Guerciová hovořila ve svém příspěvku obecně o národních a mezinárodních projektech zabývajících se digitalizací, o tom jak fungují, jaká je kvalita jejich výstupů a jak se např. stát ve svébytném prostředí těchto projektů úspěšnou organizací.
Poslední vystoupení v dopolední části měla Ute Schwensová – Digital preservation: experience of cooperation among libraries, archives and museums [21 [27]]. Pohovořila především o německém projektu Nestor [22 [28]] - Network of Expertise in Long-Term Storage of Digital Resources, který je sítí expertů a tematickým portálem pro všechny zájemce o problematiku ochrany digitálních dokumentů. Cílem bylo vytvořit síť expertů pro sdílení znalostí a vzájemnou komunikaci mezi nimi. To má podpořit obecné povědomí veřejnosti a podpořit kooperaci mezi institucemi. Na portálu je v současné době velmi mnoho výstupů vzniklých z různých projektů a kooperací.
Příspěvek Francesca Nucciho a Massima Bertonciniho [23 [29]] popisoval některé nové perspektivy a aspekty ekonomického scénáře, který bere v potaz obecná doporučení jakož i specifické obchodní modely pro média. Konkrétně se jednalo o tzv. long tail model a tzv. prosumer koncept. Vito Cappellini přednesl rozsáhlý referát o systémech pro správu digitálních práv [24 [30]]. Popsal většinu identifikačních systémů a způsobů, jakým fungují (identifikátory, formáty, watermarking atd.). Dietrich Schűller (Phonogrammarchiv, Vídeň) [25 [31]] hovořil o nebezpečí ztráty zvukových a audiovizuálních dokumentů z důvodů špatné manipulace, uložení a hlavně degradace nosičů a zastarávání formátů (přehrávačů). Týká se i šelakových/vinylových desek, magnetických pásek a moderních nosičů, jako jsou CD/DVD.
Zmíněné dokumenty jsou přitom velmi důležité pro dokumentaci obecných dějin, protože v podstatě bezezbytku zachycují všechny podstatné události (např. v rozhlase). Řešením může být přenesení všech záznamů do digitální podoby na Digital Mass Storage Systems (v podstatě důvěryhodné úložiště). Brání tomu často velmi malá povědomost o celkovém rozsahu tohoto problému. To chce napravit projekt TAPE [26 [32]] v rámci programu Culture2000, který je zaměřen na osvětu a pořádání instruktážních kurzů. Podobnému problému, archivaci streamovaného vysílání rozhlasu a televizního vysílání, se věnoval Philippe Poncin (INA - Národní audiovizuální institut, Paříž) ve svém příspěvku Preservation and accessibility on Internet of audio-visual collections [27 [33]]. Popsal, co vše INA archivuje a jak se fungování dotkla platnost „povinného výtisku“ televizního a rozhlasového vysílání (od r. 1995). Dle jeho slov jde o 60 let vysílání rádia a 50 let televizních záznamů. V instituci samozřejmě běží program digitalizace a samotné digitální dokumenty, včetně digitálního vysílání, se ukládají v datovém úložišti. Velmi poutavě vypadá internetová prezentace instituce [28 [34]], která nabízí nepřeberné možnosti využívání archivu pro všechny druhy zájemců.
Poslední sekci druhého dne s názvem The user’s point of view and organisational issues zahájil jako hlavní řečník Paolo Buonora s příspěvkem Digital migration and organisational issues for cultural institutions [29 [35]]. Konstatoval, že nároky uživatelů se mění, fungování institucí také a instituce potřebují formulovat svou nabídku uživatelům. Uživatel potřebuje mít jistotu, že zdroje budou stále dostupné a že se dostane k novým zdrojům bez omezení. Instituce tedy musí zajistit ochranu dokumentů, lepší přístup k nim a nabídnout digitální studijní prostředí. Mezi uživatelem a digitální sbírkou musí existovat důvěra, založená např. na jednoznačném identifikátoru, možnosti aktivního přístupu ke sbírkám apod. Podobným tématem navázala Anna Maria Tammarová, která prezentovala případovou studii The digital library users: a case study on needs, expectations and skills [30 [36]]. Průzkum se týkal všech paměťových institucí a různých druhů digitálních sbírek. Cílem studie bylo získat poznatky o nárocích uživatelů a zlepšit tak služby samotných digitálních knihoven. Ukázalo se, že uživatelé by preferovali jednotný přístup (rozhraní) pro více digitálních sbírek a větší interakci.
Další příspěvek pronesla Rowena Loveranceová - Digital preservation of user-generated content: the next challenge for museum, libraries and archives [31 [37]]. Zabývala se moderními způsoby vyjádření a sdílení kolektivní paměti na internetu, jak jí dnes využívají mnohé komunitní SW (např. Flickr, myspace.com apod.) i instituce, které mají na svých stránkách možnost např. kreslit obrázky (pro dětské návštěvníky), vystavovat staré fotografie, psát příběhy vlastní rodiny, města, navrhovat design apod. Pomáhají takto budovat komunitní povědomí a sdílet osobní vzpomínky. Většina těchto institucí ovšem nemá žádnou politiku, jak tento elektronický materiál ukládat, některé to nezajímá, některé se ptají, čí vlastně tento materiál je, některé zaručují dostupnost pouze po určitou dobu. Lidé, kteří se těchto aktivit účastní, ovšem očekávají, že budou nápomocní a jimi přidaný obsah bude zachován. Otázkou je i využití v budoucnu nebo třeba i problém s metadaty k takovým materiálům.
Zajímavý byl i referát z praxe od Tommasa Giordana (European university institute, Fiesole) [32 [38]], který provedl přítomné problematikou spojenou s managementem elektronických zdrojů a ukázal hrozby, které s sebou přinášejí např. elektronické časopisy. Nebezpečí spočívá v tom, že knihovny, které si objednají elektronický časopis, často přestanou odebírat jeho papírovou verzi (v 85 % případů) a velmi často si myslí, že elektronickou verzi nemusí chránit, protože to dělá někdo jiný, např. jiná větší knihovna, vydavatel apod. Neuvědomují si, že kupují často pouze přístup do databáze, který ztratí v okamžiku, kdy přestanou vydavateli platit a přijdou tak např. o přístup k celým ročníkům časopisů. Zároveň v knihovně není papírová (mikrofilmová) verze. Celé paradigma přístupu k časopisům se tím pádem v knihovnách mění, ovšem pohled na problematiku ochrany se za posledních 15 let nezměnil (i přes příchod e-zdrojů). Podle Giordana se změnil ekonomický model, už se nehromadí sbírky pro budoucnost, ale pronajímají se dokumenty pro současnost. Ranghanathanův 5. zákon „Knihovna je rostoucí organismus“ je tímto zpochybněn.
Předposlední příspěvek celé konference měla Catherine Lupoviciová, která se lehce dotkla problematiky archivace webu [33 [39]]. Zmínila velmi krátkou průměrnou životnost dokumentů na internetu a představila snahy Francouzské národní knihovny v této oblasti. Ve Francii začal v r. 2006 platit zákon o povinném výtisku internetových (resp. elektronických) dokumentů.
Poslední referát dne a celé konference přednesl Stefano Vitali pod názvem The science of context: sharing knowledge among archives, libraries and museums descriptive systems [34 [40]]. Zabýval se možností společného přístupu k popisu dokumentů všech paměťových institucí z jednotného rozhraní, zejména využitím Z39.50 a OAI-PMH pro tento účel.
Podle mého názoru sdělila konference pouze minimum nového, většina příspěvků konstatovala již známé, dříve slyšené a prezentované skutečnosti. Užitečné pro našince bylo sledovat, jak aktivní je odborná komunita v Itálii, o čemž nemáme u nás díky jazykové bariéře tolik dostupných informací.
DPE Workshop
Sobotní dopoledne bylo věnováno evropskému projektu The Digital Preservation Europe (DPE) [35 [13]] a workshopu s názvem Scholarly research citation of web resources and long-term preservation [36 [41]]. Workshopu se účastnili registrovaní zájemci z řad odborníků a členů projektového týmu DPE. Workshop probíhal jako tzv. nekonference [37 [42]], tedy stylem moderované debaty všech zúčastněných na určitá témata. Uvádím pár postřehů.
Celou debatou se prolínala nevyjasněnost tématu, někteří účastníci mluvili o citacích jako takových, např. o citacích klasických dokumentů a o tom, jak by měly vypadat. Naproti tomu druhá polovina si spojovala problém s citacemi dokumentů elektronických, většinou v prostředí internetu, což souvisí s velmi omezenou životností takových dokumentů. Tento rozpor zůstal po celou dobu nevyjasněn. Jak trefně konstatoval jeden z účastníků, velký rozdíl v otázkách životnosti existuje i v rámci elektronických dokumentů přístupných přes internet. Ty totiž mohou být pouze přímo „na internetu“, tj. na nějakém serveru bez zálohy, anebo mohou být součástí nějakého úložiště a do prostředí internetu se dostává jen jejich kopie. V prvním případě je životnost minimální a předpokládá se, že tyto dokumenty si žijí vlastním životem, tj. od jejich vystavení na internet svého tvůrce už velmi často nezajímají, v druhém případě existuje silný předpoklad, že dokumenty mají maximální péči a budou dostupné velmi dlouho.
Dobré bylo si poslechnout názory na otázku, proč vlastně existují citace? Podle jedněch proto, že nevěříme autorům. Zároveň samozřejmě pomocí citací chtějí autoři dodat svým pracím „vážnost“ a také chtějí poskytnout čtenáři možnost ověřit hodnotu jimi uváděných informací.
Zajímavé bylo konstatování, že průměrně udávaná životnost stránky na webu je někde mezi 40-100 dny. To je všeobecně známá skutečnost, ovšem většina lidí si neuvědomuje, že se v podstatě mluví o životnosti URL, stránka na tomto URL se totiž může měnit, což z hlediska citací není to pravé (např. pokud bychom chtěli citovat heslo ve Wikipedii, které se může velmi rychle měnit). V tomto případě nepomůže ani PURL - Persistent Uniform Resource Locator [38 [43]]. Ovšem lze říci, že čím více je dokument citován, tím větší je šance, že jej na stejné lokaci nalezne i později.
Probíralo se také, kde má dokument na internetu a vlastně citovaný dokument hranice. Můžeme říci, že dokument je prostě bitstream a vše ostatní jsou metadata, jak to řekl jeden z účastníků debaty? Jistě je to jeden z možných pohledů.