Konference ECDL 2002
Ve dnech 16. - 18. září se v Římě konala šestá evropská konference „Výzkum a pokročilé technologie pro digitální knihovny [4]“. Letošní konference byla zaměřena především na principy, metody, systémy a nástroje potřebné k vytvoření a zpřístupnění efektivní digitální knihovny uživatelům. Hlavními tématy letošní konference tak byly mimo digitálních knihoven obecně i jejich architektura, metadata, tvorba sbírek, archivace webu, webové technologie, elektronické knihy, aplikace OAI (Open Archives Initiative), ochrana fondů, navigace, dotazovací jazyky, práce s multimédii, analýza přirozeného jazyka a vazba na uživatele.
61 členný programový výbor konference vybral z celkem 145 příspěvků 48 nejlepších, přičemž každý nabídnutý příspěvek byl posouzen třemi posuzovateli. Program konference byl pak doplněn dvěma zvanými přednáškami, dvěma panelovými diskusemi a byl vyhrazen i čas a prostor pro prezentace a demonstrace mimo hlavní program konference.
Samotné konferenci předcházely tři a tři paralelně probíhající půldenní kursy:
-
Úvod do analýzy a rozpoznání obrazu dokumentu [5] (DIAR) byl zaměřen na problematiku přesahující klasické optické rozpoznávání písma (OCR). Zabýval se problémy typu rozpoznání ručně psaného písma, zpracování obrazových souborů z webu, obsahujících text, nebo analýza struktury dokumentu.
-
Kurs „Aspekty dlouhodobé ochrany digitalizované nebo přirozeně digitální informace [6]“ pokrýval celou problematiku tvorby, správy, zpřístupnění a dlouhodobé ochrany (konverze, emulace, virtuální stroje) digitálních knihoven
-
Využitím programového systému digitální knihovny Greenstone [7] se zabýval kurs „Jak vytvořit digitální knihovnu s využitím softwaru s otevřeným kódem [8]“
-
Kurs „Pokrok v geograficky orientovaných digitálních knihovnách [9]“ popisoval výsledky projektů Alexandria Digital Library a ADEPT na Kalifornské univerzitě v Santa Barbaře.
-
Úvod do thesaurů a ontologií v digitálních knihovnách [10] diskutoval jejich vnitřní strukturu a výhody jejich využití.
-
Kurs „Digitalizace sbírek mluveného slova [11]“ uvedl posluchače do problematiky a zaměřil se i na vyhledávání v těchto sbírkách [12]. Zabýval se problematikou digitalizace, transkripce, synchronizací textu a mluveného projevu a převodem mezi mluveným slovem a textem.
Samotná konference byla zahájena přednáškouWebBase: budování webové digitální knihovny [13]. Hector Garcia-Molina ze Stanfordské Univerzity v ní popsal projekt WebBase, který je pokračováním vývoje, který vyprodukoval prohledávač Google. Cílem současných aktivit vývojového týmu je vývoj nových algoritmů pro automatické budování obsahově aktuálních předmětově orientovaných sbírek webových dokumentů, jejich klasifikaci, zpřístupnění a další šíření prostřednictvím multicastových kanálů. Během přednášky byla mimo jiné diskutována i problematika automatického stanovování autenticity dokumentů.
Po této přednášce pokračoval program tematickými bloky ve dvou oddělených sekcích. V tematickém bloku WebArchiving nejprve Julien Masanes prezentoval první zkušenosti francouzské národní knihovny s archivací národního webu [14], přičemž se zaměřil především na postupy jak automaticky identifikovat z hlediska knihovny důležité stránky (PageRank Googlu) a jak určit jak často je nutné které stránky archivovat. Diskutoval i problematiku granularity (webová stránka vs. webové sídlo) a problematiku prezentace archivovaných dokumentů (automatická tvorba jednoho dokumentu z jeho jednotlivých verzí). Na tuto přednášku navázal Andreas Rauber z Vídeňské Technické Univerzity přednáškou o projektuanalýzy archivu rakouského webu [15] s využitím technologií datových skladů. Tato analýza byla zaměřena ne na vlastní informační obsah archivu, ale spíše na technologie, použité k poskytnutí daných informací.
V paralelně probíhající sekci zaměřené na elektronické knihy zazněla nejprve přednáška Seung-Kyu Ko, zabývající se konverzí formátů elektronických knih [16]. Byly diskutovány převody a mapování mezi formáty EBKS [17],OEB PS [18] a JepaX [19], používanými v uvedeném pořadí v Jižní Koreji, Spojených státech a Japonsku. Přednáška Ruth Wilson pak přinesla doporučení [20],jak postupovat při tvorbě elektronické knihy [21] aby odpovídala potřebám uživatele jak z hlediska softwaru, tak z hlediska hardwaru.
Následující sekci zaměřenou na tvorbu sbírek zahájila přednáška Aixin Sun ze Singapuru o tvorbě klasifikačních kategorií definovaných uživatelem na základě klíčových slov [22]. Na ni navázal Atsuhiro Takasu z Japonska přednáškou o statistické analýze bibliografických řetězců [23], která se zabývala analýzou citačních odkazů obsažených v naskenovaných článcích a jejich mapováním na bibliografické záznamy odkázaných dokumentů. Sekci pak uzavřela přednáška Donny Bergmark na téma focused crawls - tedy tematicky zaměřené automatické procházení webu [24]. Pro automatickou tvorbu malých, tematicky zaměřených sbírek v rámci projektu National Science Digital Library (NSDL [25]) bude zapotřebí nalézt na webu nejrelevantnější dokumenty. Popsaný postup vychází z vyhledání 4-7 prvních dokumentů na googlu na základě vhodně zvolených klíčových slov; tyto dokumenty pak slouží jako výchozí bod pro další prohledávání webu, archivují se však přitom jen ty stránky, které jsou relevantní k danému tématu a nezachází se do příliš velké vzdálenosti od již nalezených stránek.
Paralelní sekce o webových technologiích zahájil Davide Bolchini přednáškou Specifikace na výsledek zaměřených požadavků pro digitální knihovny [26]. Autorem představený přístup byl vyvinut a ověřen v rámci projektu UWA [27]. V následující přednášce prezentoval Jon Heggland systém OntoLog [28]– systém pro anotování audio a video záznamů. Jde o program napsaný v jazyce Java a využívající ontologií, aplikačních profilů a RDF pro popis vzájemně se překrývajících úseků záznamu. Sekci uzavřela přednáška Edwarda Foxe, navrhující jednotný standard pro logování na bázi XML [29] a představující nástroje pro analýzu takového logu. Tento standard umožní jednotnou analýzu využívanosti digitálních knihoven a bude nasazen v mnoha nyní budovaných digitálních knihovnách v USA.
Odpolední program byl v sekci OAI [30] aplikací zahájen přednáškou Dony Bergmark, zaměřenou na nejnovější vývoj v oblasti OAI [31], informující především o nové verzi OAI protokolu pro sklízení metadat (OAI-PMH). Poté následovala Suzanne Little s přednáškou Dynamické generování inteligentních multimediálních prezentací na základě sémantického dovozování [32]. Tuto sekci uzavřela přednáškaVýměna technických zpráv prostřednictvím synchronizovaných OAI keší [33], která popsala projekt využívající OAI-PMH pro sdílení technických zpráv mezi čtyřmi americkými výzkumnými institucemi.
Paralelní sekce zaměřená na případové studie začala přednáškou Michaela Khoo Funkční požadavky na online nástroje pro podporu komunitou vedené tvorby sbírek [34] popisuje zkušenosti z vývoje a provozování Digital Water Education Library [35]– digitální knihovny budované učiteli základních a středních škol v USA. Následovala studie Suk-Ki Hong o modelu hodnocení univerzitních knihoven v digitálním prostředí [36]. Poté Lesly Huxley seznámila [37]účastníky s aktuálním stavem projektuRenardus [38], evropské akademické předmětové informační brány, poskytující vícejazyčný přístup k více než 65.000 záznamů ve dvanácti evropských předmětových branách. Jednání sekce uzavřela přednáška Stephana Kiemleho popisujícíDIMS [39] - digitální knihovnu pro správu dat získaných pozorováním Země z vesmíru.
První den konference byl ukončen panelovou diskusí na téma OCKHAM [40]: koordinace vývoje digitálních knihoven prostřednictvím lehkých referenčních modelů [41]. Hlavním tématem diskuse byla snaha o prosazení jednotných standardů v oblasti návrhu a vývoje digitálních knihoven.
Druhý den konference byl zahájen zvanou přednáškou Dereka Lawa Digitální knihovna jako praktický nástroj. V této přednášce popsal budování a zkušenosti z provozu Glasgowské digitální knihovny [42] a její význam pro místní komunitu. Zdůraznil také nutnost stanovení „exit strategy“, tedy strategie dalšího rozvoje každého obdobného projektu po ukončení grantového financování.
Pokračování prezentací v sekcích zahájila přednáška Tronda Aalberga navigování v bibliografických katalozích [43], ve které popsal prototyp rozšíření webového katalogu knihovny o vazby definované IFLA FRBR [44]modelem pomocí externí nadstavby nad existujícím katalogem. Na tuto přednášku navázala přednáška Carla Meghiniho, který představil matematický modeldotazovacího jazyka pro digitální knihovny [45], vycházejícího z matematické formulace IFLA FRBR modelu.
Paralelní sekce zaměřená na multimédia začala zprávou z video sekce [46] desáté Text Retrieval Conference 2001 [47] a byla uzavřena přednáškou Gareth Jones na téma automatické synchronizace a anotování audiovizuálních prezentací [48].
První skupina přednášek zaměřených na architekturu digitálních knihoven zahájila Donatella Castelli popisem softwarového systémuOpenDLib [49], systému pro federaci služeb digitálních knihoven, tedy systému pro zajištění integrace modulů digitální knihovny a jejich vzájemné komunikace. Na ni navázal Ross MacIntyre přednáškou o testování technologií digitálních knihoven v systému zetoc [50], který v současné době zpřístupňuje 20 milionů záznamů článkového katalogu Britské knihovny. Systém zetoc [51]sdružuje technologie Z39.50, OpenURL (zatím jen source, v budoucnosti i target), testuje se SFX, experimentuje se s technologiemi ISO ILL a ve stadiu úvah je rozšíření zetoc o funkce OAI. Sekci zakončila přednáška Jin-Cheon Na Využití chytrých browserů pro podporu pružné prezentace informací [52].
Sekci zaměřenou na získávání informací zahájila přednáška Iana Ruthvena O využití vysvětlivek jako zpětné vazby pro zlepšení relevance [53]. Po ní následovala přednáška Dorothee Blocks Kvalitativní vyhodnocení na thesauru založeného hledání [54], popisující některé výsledky projektuFACET [55]. Sekci zakončila přednáška Roberta StrötgenaExtrakce metadat a převod dotazu [56], v níž se autor zaměřil na problematiku automatické tvorby metadat z HTML dokumentu a na sémantickou interoperabilitu při prohledávání více různých zdrojů.
Pokračování sekce zaměřené na architekturu systémů začalo přednáškou Filie Makedon popisující systém MetaDL – digitální knihovnu citlivých nebo speciálních výzkumných dat [57]. Tento systém řeší sdílení metadat o údajích získaných v lékařském výzkumu a problematiku oprávnění přístupu v rámci digitální knihovny BrassDL [58]. Následující přednáška Davida Bainbridge popsala problematiku importu dokumentů a metadat [59]různých formátů do digitální knihovny. Doporučuje především neexkluzívní využití interních formátů na bázi XML a zásuvných modulů pro jednotlivé formáty a svá tvrzení dokládá příkladem softwaru digitální knihovny Greenstone a její aplikace v Digitální knihovně Nového Zélandu [60]. Poté Thornton Staples představil Mellonovou nadací podporovaný projekt Fedora [61], jehožvýsledkem [62] by mělo být uvolnění tohoto škálovatelného systému digitální knihovny v lednu 2003 jako volně šiřitelného s otevřeným kódem. Tento systém využívá pro uložení digitálních objektů schéma METS [63] a implementuje standardy WSDL [64] a SOAP [65]pro popis služeb svázaných s digitálními objekty.
Paralelní sekce byla zahájena přednáškou Wensi Xi na téma rozdělení invertovaného indexu [66] obrovského objemu dat. Následovala přednáška Johana Bollena [67] Posouzení digitální knihovny analýzou vzorů jejího využívání. Autor se v ní pokusil stanovit metodiku zjištění impact faktoru pro elektronicky publikované dokumenty a sbírky dokumentů. Sekci ukončila přednáška Ioannise Papadakise Interaktivní výsledky vyhledávání [68], ve které řeší problematiku zpřesnění seznamu výsledků hledání.
Program druhého dne konference uzavřela panelová diskuse na téma vytvoření metodologie pro hodnocení použitelnosti akademiských digitálních knihoven [69].
Jednání třetího dne konference započala ve dvou sekcích. První z nich, zaměřená na multimédia, zahájil Gareth Jones přednáškouVýzkum získávání informací z různých druhů médií [70]. Na ni navázal Nicola Orio přednáškou na téma synchronizace záznamu představení a notového záznamu [71]v digitálních knihovnách. Další přednáška pojednávala o výzkumu pomocných nástrojů, vhodných pro zkvalitnění práce s video objekty [72]. Sekci uzavřela přednáška zaměřená na synchronizaci textu a záznamu jeho přednesení člověkem [73].
Druhá sekce byla zahájena přednáškouMigrace na vyžádání, praktická technika pro ochranu [74]. Autoři v rámci řešení projektuCAMiLEON [75] vyvinuli nástroje, vycházející z teze, že nejvhodnějším způsobem zachování digitální informace bez zkreslení je využití přechodného formátu pro každý typ dokumentů. Tento přechodný formát by měl být použit pro archivaci a veškeré konverze by měly probíhat z a do něj. Tím by se zajistilo, že v průběhu série po sobě v čase jdoucích migrací nedojde ke zkreslení obsahu konvertovaného dokumentu, nebo že půjde o zkreslení dočasné. Na tuto přednášku navázalaprezentace systému DIAS [76], upozorňovací služby vyvinuté v rámci projektu DIENST. V následující přednášce představila MacKenzie Smith projekt [77] DSpace [78]: digitální archiv knihoven MIT a laboratoří HP [79]. Tento systém využívající standardy METS, DC (Library application profile) [80] a OAIS nyní postupně přechází do ostrého provozu na MIT a v budoucnosti by měl být uvolněn do distribuce s otevřeným kódem. Následující přednáška Sarantose Kapidakise byla věnována analýze chování uživatelů digitální knihovny [81]. Sekci uzavřela přednáška věnovaná porozumění studentů klasifikačním nástrojům v digitální knihovně [82].
Poté následovala závěrečná sekce věnovaná architektuře systémů. Zahájil ji Edward Fox přednáškou na téma Návrh protokolů pro podporu modularity digitálních knihoven [83]. Ve svém příspěvku navrhuje pro komunikaci komponent digitální knihovny použít rodinu protokolů vzniklých rozšířením protokolu OAI-PMH. Výsledkem je návrh systému otevřené a snadno rozšiřitelné digitální knihovny (ODL [84]). Následovala přednáška George Buchanana, zabývající se zpřístupněním digitální knihovny Greenstone ze systémů s malou obrazovkou [85], tedy z mobilních telefonů a handheldů. Sekci uzavřel příspěvek Clause-Petera KlaseDaffodil [86]:Integrovanný klient pro podporu vyhledávání v digitálních knihovnách [87].
Zároveň probíhající druhá sekce byla zahájena přednáškou o využívání analýzy přirozeného jazyka pro automatickou anotaci a indexování obsahu digitální knihovny [88]– v přednášce popsaný systém ANNIE je volně dostupný jako součást systému GATE [89]. Po ní následovala přednáška Gregory Cranea Digitální knihovny kulturního dědictví: potřeby a komponenty [90], popisující předběžné závěry získané během prvních tří let řešení pětiletého projektu na vybudování digitální knihovny humanitních věd [91]. Sekci uzavřela prezentace Richarda Furuty zabývající se vizualizací rozdílů mezi různými verzemi téhož díla [92]v projektu Cervantes [93].
Poté byla konference na oficiálně ukončena, nicméně doprovodný program, sestávající z několika workshopů pokračoval ještě další dva dny. Během konference mohli zájemci shlédnout mnoho demonstrací a krátkých prezentací, z nichž nejzajímavější byly: digitální knihovna fotografií Alinari Online [94], digitální knihovna Intratext [95], projekt METAe [96], nebo stánek firmy Atlantis Srl., propagující produkty SFX a Metalib.
První ze tří paralelních workshopů, které konferenci následovaly, byl zaměřen na elektronické knihy, elektronické publikování a jejich vazbu na vzdělávání [97]. Přednesené příspěvky z tohoto workshopu budou vydány ve zvláštním čísle online časopisu JoDI [98]. Druhý workshop byl zaměřen na archivaci webu knihovnami a mimo jiné na něm byly prezentovány dvě největší iniciativy v tomto oboru: plánovaný projekt konsorcia národních knihoven a americké organizaceInternet Archive [99] a projektový záměr evropských národních knihoven a výzkumných institucí European Web Archive [100]. Na tomto workshopu přednesené prezentace by se měly objevit na jeho stránkách [101]. Posledním workshopem byl neveřejný workshop konsorcia CLEF [102] (Cross-language Evaluation Forum [103]).
Celá konference se konala v prostorách Gregoriánské univerzity [104], která se pyšní tím, že mezi její absolventy patří 20 svatých, 39 blahoslavených a 16 papežů. Přes toto poněkud netypické prostředí svou náplní a průběhem potvrdila fakt, že se jedná o nejvýznamnější evropskou akci, zaměřenou na digitální knihovny a jejich (nejen) technické aspekty a je tak vhodným fórem pro setkávání odborných pracovníků, výzkumníků a stratégů tohoto oboru z celého světa.Sedmá konference ECDL [105]se odehraje 17. - 22. srpna 2003 v Trondheimu v Norsku.
Literatura: