Zpráva z konference ECDL 2006

1 comments

Autoři:

Žabička, Petr [1]

Steinerová, Jela [2]

Skolková, Linda [3]

Hutař, Jan [4]

Lhoták, Martin [5]

Kinčíková, Katarína [6]

Vydání:

2006, ročník 10, číslo 10 [7]

Rubrika:

Zprávy, reportáže a glosy [8]

Ve dnech 17.–20. 9. 2006 se ve španělském Alicante uskutečnil již 10. ročník konference ECDL [9] (European Conference on Research and Advanced Technology for Digital Libraries). Zaměření letošní konference vyjadřovalo motto Směrem k Evropské digitální knihovně (Towards the European Digital Library). Průběh konference bylo možné sledovat také prostřednictvím internetu.

Pořadatelům konference bylo doručeno celkem 130 návrhů na příspěvky, z toho 36 bylo akceptováno. Za povšimnutí stojí, že bylo akceptováno cca 60 % návrhů amerických autorů, ale jen cca 30 % autorů evropských.

Konferenční příspěvky jsou k dispozici ve sborníku:

Gonzalo, J. et al. (ed.). Research and Advanced Technology for Digital Libraries : 10th European Conference, ECDL 2006, Alicante, Spain, September 17-22, 2006 : proceeedings. Berlin : Springer, 2006. xvii, 569 s. (Lecture Notes in Computer Science, 4172). ISBN 3-540-44636-2.

Sborník z tohoto ročníku konference lze doporučit i proto, že obsahuje jako přílohu CD-ROM s elektronickou verzí sborníků ze všech deseti ročníků konference. Pro oprávněné uživatele je elektronická verze sborníku k dispozici také v rámci systému SpringerLink [10].

Přednášky klíčových řečníků

Budování evropské digitální knihovny
[Building Europe’s Digital Library]
Horst Forster (Generální ředitelství pro Informační společnost a média, Evropská komise)

[11]

Horst Forster

H. Forster se ve své přednášce věnoval aktuální problematice digitální knihovny v evropském prostoru. Představil iniciativu i2010: Budování Evropské digitální knihovny. Zdůraznil potřebu koncepčního přístupu k vytváření rozhraní a zpracování obsahu v elektronickém prostředí, k němuž by mělo docházet právě na úrovni Evropské digitální knihovny. Poukázal také na problematiku copyrightu (v mnoha zemích je nutno žádat o individuální povolení autora, aby mohly být poskytnuty digitální dokumenty, přitom autor často není vůbec znám nebo se jedná o knihy, které již nejsou na knižním trhu k dispozici) a otázky technické interoperability jednotlivých systémů. Klíčem k rozvoji Evropské digitální knihovny je integrace evropského výzkumu v oblasti digitálních knihoven.

Dotazy a klikání jako zdroj poznání
[Queries and Clicks as a Source of Knowledge]
Ricardo Baeza-Yates (ředitel Yahoo! Research Barcelona, Španělsko, a Yahoo! Research Latin America, Santiago, Chile)

[12]

Ricardo Baeza-Yates

R. Baeza-Yates naznačil nejnovější trendy v oblasti výzkumu uživatelů. Potvrdil směřování k vytváření nových sociálně podmíněných nástrojů pro vyhledávání v prostředí webu. Vznikají nová pojetí relevance informací, která modelují kontext uživatele (kdo, kde, kdy a na co potřebuje informace). Na rozdíl od orientační relevance používané při vyhledávání pomocí nástrojů typu vyhledávače Google je tímto způsobem možné získat aktuálnější a zejména personalizované výstupy z digitálních knihoven. Přednášející také představil nástroj Yahoo! Mindset [13] a názorně ukázal možnosti jeho použití. Upozornil, že uživatelé chtějí méně informací a naopak mají zájem o získání kontextu k vyhledaným informacím. Personalizace by se již nyní neměla týkat uživatele, ale personalizován by měl být úkol, který uživatel provádí. Dotazy, které uživatel pokládá vyhledávacímu stroji, lze za tímto účelem vytěžovat (query mining).

Jeden obrat k dobrému si zasluhuje další: jak mají všichni prospěch z projektu Google Book Search
[One good turn deserves another: how the Google Book Search project is benefiting everyone]
Michael A. Keller (knihovník v knihovně Ida M. Green University ve Stanfordu, ředitel Akademických informačních zdrojů)

M. A. Keller ve své přednášce shrnul současný stav projektu Google Book Search [14]. Zdůraznil, že masová digitalizace přináší prospěch jak v současné době, tak v dlouhodobém výhledu. Zmínil také prokazatelný nárůst výpůjček tradičních knih v důsledku digitalizace lístkového katalogu. Většina přednášky se však týkala přímo projektu společnosti Google – mezi digitalizované knihy patří také málo užívané a neobvyklé tituly, které však mají pro akademickou sféru vysokou důležitost. Ze zajímavých (polemických) zdrojů o projektu jmenoval přednášející např. článek Kevina Kellyho Scan This Book! [15], který byl publikován v květnu 2006 v New York Times Magazine.

Sekce 1: Architektury I

OpenDLibG: Rozšiřování OpenDLib využitím gridové infrastruktury gLite
[OpenDLibG: Extending OpenDLib by Exploiting a gLite Grid Infrastructure]
Leonardo Candela, Donatella Castelli, Pasquale Pagano, Manuele Simi

První příspěvek v sekci Architektury I se zabýval italským systémem OpenDLib, představeným již v předchozích ročnících konference. V příspěvku OpenDLibG: Extending OpenDLib by Exploiting a gLite Grid Infrastructure autoři ukázali, jak byl v systému OpenDLib využit grid gLite pro ukládání dat. Díky využití gridu dokáže OpenDLib pracovat i s dokumenty, které mají velké nároky na úložný prostor, jako jsou obrázky, video a reprezentace trojrozměrných objektů. Díky možnosti využití výpočetního výkonu gridu je také možné tyto dokumenty vytvářet na vyžádání z dynamických dat. Do budoucna se nabízí i možnosti využít gridu pro úlohy z oblasti kryptografie (zajištění ochrany autorských práv) apod. Nevýhodou gridu je však riziko spojené s tím, že určité části gridu mohou neočekávaně zmizet, dále pak vyšší nároky na přenos dat a dávkové zpracování úloh.

Architektura výměnných sítí pro vyhledávání informací napříč fondy digitálních knihoven
[A Peer-to-Peer Architecture for Information Retrieval Across Digital Library Collections]
Ivana Podnar, Toan Lu, Martin Rajman, Fabius Klemm, Karl Aberer

Druhý příspěvek s názvem A Peer-to-Peer Architecture for Information Retrieval Across Digital Library Collections přednesl Toan Lu. Výměnné sítě jsou velmi rozšířené a slibně vyhlíží i možnost využití jejich principu pro prohledávání sbírek digitálních knihoven, které většinou bez problémů zvládají prohledávání lokální sbírky, ale jen obtížně je z nich možné vytvořit rozsáhlejší paralelně prohledávanou síť. Navržená vyhledávací architektura pro strukturované P2P sítě používá indexaci založenou na strategii klíčů (sad termínů) volených tak, aby odpovídaly jen malé části dokumentů z dané sbírky. Tím je dosaženo redukce globálního indexu a přijatelných nákladů na indexaci.

Generace škálovatelných sémantických překryvů pro digitální knihovny založené na P2P
[Scalable Semantic Overlay Generation for P2P-Based Digital Libraries]
Christos Doulkeridis, Kjetil Norvag, Michalis Vazirgiannis

Poslední příspěvek sekce nazvaný Scalable Semantic Overlay Generation for P2P-Based Digital Libraries a přednesený Christosem Doulkeridisem se (na rozdíl příspěvku předcházejícího) zabýval P2P sítěmi nestrukturovanými. Protože v takových sítích není přesně znám jejich obsah ani topologie, vyžadují tyto sítě automatizované systémy pro organizování obsahu a efektivní nástroje pro vyhledávání. Příspěvek přináší řešení tohoto problému v podobě decentralizované semantické sítě DESENT. Ta je založena na rekurzívním sdružování těch uzlů sítě, které mají navzájem podobný obsah. Autoři ukazují, že toto řešení 3-10x zlepší odezvu systému v závislosti na topologii sítě.

Sekce 2: Uchovávání

Přehodnocení přístupu a uchovávání prostřednictvím druhotných repozitářů: Potřeby, sliby a výzvy
[Reevaluating Access and Preservation Through Secondary Repositories: Needs, Promises, and Challenges]
Dean Rehberger, Michael Fegan, Mark Kornbluh

Otázky přístupu a ochrany k digitálním fondům institucí ochraňujících kulturní dědictví se zaměřily primárně na repozitáře, tj. na sbírky sestávající z jednotlivých digitálních objektů a s nimi asociovaných metadat. Většina toho, co je na informačním věku slibného, ovšem vězí ve schopnosti znovu použít, najít jiný důvod využití, kombinovat a postavit komplexní digitální objekt. Repozitáře potřebují zároveň zajišťovat ochranu a také přístup k primárním digitálním objektům. Autoři příspěvku se v návaznosti na tyto teze snažili argumentovat pro vznik tzv. druhotných repozitářů, kde by uživatel mohl sám komponovat (skládat) strukturované sbírky komplexních digitálních objektů. Tyto komplexní digitální objekty disponují odkazy zpět na primární digitální objekty, ze kterých se vlastně skládají (obvykle pomocí URI) a obohacují tyto odkazy pomocí anotací a metadat přidávaných uživateli. Příspěvek se zabýval otázkou, jak tento „vrstevnatý” přístup k metadatům generovaným uživatelem může umožnit komunitám výzkumníků a vědců pokročit směrem k daleko více komplexním otázkám ohledně digitální archivace a ochrany, týkajících se nejen základních výzev ochrany jednotlivých digitálních objektů z dlouhodobého hlediska, ale i otázek přístupu a využitelnosti, kterým čelí jednotlivé instituce ve svých primárních digitálních repozitářích - vědci, učitelé a studenti. Konkrétně se prezentovaný projekt zabýval rolí druhotných repozitářů v oblasti ochrany a přístupu k dokumentům digitálního historického a kulturního dědictví s důrazem na tzv. streamovaná média.

Replikace repozitářů pomocí NNTP a SMTP
[Repository Replication Using NNTP and SMTP]
Joan A. Smith, Martin Klein, Michael L. Nelson

Příspěvek představil výsledky realizační studie využívající sdílené, již existující, po síti dostupné infrastruktury pro replikaci repositářů. Autoři použili protokoly SMTP a NNTP k replikaci jak metadat, tak i obsahu digitální knihovny, přičemž použili OAI-PMH k ulehčení ovládání archivačního procesu. Zjistili, jak rozšiřování obsahu repozitáře lze využít „nad“ již existující výměnou pomocí elektronické pošty či Usenetu. Dlouhodobá stálost replikovaného repozitáře je dosažitelná díky již existujícím pravidlům a postupům, které zajišťují to, že emailové zprávy a tzv. news jsou vyhledatelné pro důkazové a jiné právní účely i za velmi dlouhou dobu po datu jejich vzniku. Protože otázky migrace a emulace nejsou účelem tohoto přístupu, poskytuje přístup pouze jednoduchou metodu obnovování obsahu pomocí neznámých partnerů pro menší digitální repozitáře, které nemají zdroje pro promyšlenější řešení.

Žánrová klasifikace při automatickém zahrnutí do digitální knihovny a hodnotící metadata
[Genre Classification in Automated Ingest and Appraisal Metadata]
Yunhyong Kim, Seamus Ross

Vytváření metadat je klíčový aspekt následného zahrnutí (v originále ingest) digitálního materiálu do digitálních knihoven. Metadata potřebná k dokumentaci a správě digitálních materiálů jsou rozsáhlá a jejich ruční vytváření velmi nákladné. Digital Curation Centre (DCC) podniklo průzkum, jak by bylo možné tento proces automatizovat pro určité skupiny digitálního materiálu. Prvním krokem bylo tedy rozdělení na žánry. Autoři navrhli klasifikační metodu postavenou na pěti pohledech na dokument - jako na objekt vykazující specifický vizuální formát, jako na lineární strukturu řádků s charakteristickou gramatikou, jako na objekt se stylometrickými známkami, jako na objekt vytvořený s jistými pohnutkami a za jistým účelem a jako na objekt propojený k již dříve klasifikovaným objektům a na externí zdroje. Výsledky tohoto experimentu byly tématem příspěvku.

Sekce 3: Vyhledávání

Využití souhrnů ve vyhledávání pomocí XML
[The use of summaries in XML retrieval]
Zóltán Szlávik, Anastasios Tombros, Mounia Lalmas

Zoltán Szlávik v příspěvku upozornil, že dostupnost logické struktury dokumentů v systémech využívajících XML umožňuje vylepšit vyhledávání (zejména z pohledu uživatele). Zatím však nebylo systematicky zkoumáno, jak může struktura dokumentu posloužit tak, aby uživateli byla nápomocná při vyhledávání. Uživateli může být při prohlížení (browsingu) zobrazován souhrn dokumentu (přehled jeho struktury i obsahu) a jednotlivých prvků (přehled obsahu). Pro uživatele je výhodnější, jsou-li mu prezentovány vyhledané odstavce – není tak nucen pracovat s celým dokumentem. Při průzkumu uživatelů bylo zjištěno, že je-li uživateli prezentováno méně shrnutí dokumentů, mají více času na to, aby si je přečetli. Je-li nabízeno více shrnutí dokumentu, uživatelé stráví jejich četbou kratší čas.

Vylepšené vyhledávací rozhraní pro objevování informací v digitálních knihovnách
[An Enhanced Search Interface for Information Discovery from Digital Libraries]
Georgia Koutrika, Alkis Simitsis

V příspěvku byl prezentován prototyp vyhledávacího systému, který generuje personalizované prezentace výsledků na základě vyhledávání provedeného pomocí klíčových slov. Vychází ze situace, kdy je na webu publikováno velké množství informací, které jsou ve strukturované nebo polostrukturované podobě. Většina uživatelů však neumí pracovat se strukturovanými dotazovacími jazyky, je proto nutné co nejvíce usnadnit přístup k těmto informacím. Kromě vyhledání konkrétní informace prezentovaný vyhledávací systém disponuje také schopností informace nalezené v různých zdrojích vzájemně propojit a prezentovat je dle předem připravené šablony. Budoucí výzkum bude zaměřen na zjištování, jak by systém mohl pracovat na základě zpětné vazby od uživatelů.

Most TIP/Greenstone: Služba pro mobilní přístup k digitálním knihovnám
[The TIP/Greenstone Bridge: A Service for Mobile Location-Based Access to Digital Libraries]
Anika Hinze, Xin Gao, David Bainbridge

Tento příspěvek nebyl na konferenci přednesen, jeho text je však obsažen ve sborníku. Je v něm představena kombinace mobilního průvodce pro turisty s digitální knihovnou.

Sekce 4: Architektury II

Směrem k další generaci systému CiteSeer: Flexibilní architektura pro rozvinutí digitální knihovny
[Towards Next Generation CiteSeer: A Flexible Architecture for Digital Library Deployment]
Isaac G. Councill, C. Lee Giles, Ernesto Di Iorio, Marco Gori, Marco Maggini, Augusto Pucci

CiteSeer [16] se stal prvním vyhledávačem vědecké literatury. V současné době indexuje přes 730 000 dokumentů z akademické sféry. Stále více se však ukazuje nutnost výrazně vylepšit kvalitu služeb poskytovaných tímto vyhledávačem. V příspěvku byla prezentována nová verze systému označovaná jako CiteSeer Plus. Nový systém zachovává základní funkcionalitu původního systému, je však zvýšena jeho flexibilita a je rovněž využita technologie webových služeb.

Prototypy digitálních objektů: Efektivní realizace typů digitálních objektů
[Digital Object Prototypes: An Effective Realization of Digital Object Types]
Kostas Saidis, George Pyrounakis, Mara Nikolaidou, Alex Delis

Prototypy digitálních objektů umožňují projektantovi digitální knihovny modelovat stejným způsobem různé typy těchto objektů. Ty pak automaticky splňují definice konkrétních typů. Prototopy digitálních objektů mohou zefektivnit zachycování a vyjadřování informace o typu digitálního objektu a napomoci při vývoji unifikovaných webových služeb digitálních knihoven. V tradičních digitálních knihovnách je naproti tomu nutno implementaci každého typu dokumentu přizpůsobovat.

Projektování, implementace a vyhodnocení pomocného nástroje pro zakládání digitálních knihoven založené na složkách
[Design, Implementation, and Evaluation of a Wizard Tool for Setting Up Component-Based Digital Libraries]
Rodrygo L. T. Santos, Pablo A. Roberto, Marcos André Gonçalves, Alberto H. F. Laender

V příspěvku je představen pomocný nástroj pro zakládání digitálních knihoven. Jeho cílem je pomoci uživatelům úspěšně se zhostit netriviálního úkolu konfigurace softwarových prvků tak, aby se jim podařilo úspěšně vytvořit plně funkční digitální knihovnu.

Sekce 5: Aplikace

Projektování digitální knihovny pro medicínsko-právní dokumenty z počátku 20. století
[Design of a Digital Library for Early 20th Century Medico-legal Documents]
George R. Thoma, Song Mao, Dharitri Misra, John Ress

Příspěvek autorů z Národní lékařské knihovny v americké Bethesdě byl zaměřen na otázky spojené s prací na systému pro uchovávání a zpřístupňování významných vládních dokumentů historikům medicíny a práva. Vzhledem k velkému množství dokumentů bylo nezbytné zaměřit se na automatickou extrakci popisných metadat. Ta je prováděna na základě identifikace klíčových částí dokumentu. V Národní lékařské knihovně pracují s dokumenty v řadě formátů (od formátu TIFF po formát XML). Kromě řešení problému, jak získat metadata, se také zabývají otázkami zastarávání médií a formátů. Cílem výzkumu v oblasti uchovávání digitálních dokumentů pro budoucnost je nalezení nákladově efektivní strategie uchovávání těchto dokumentů. U nich jsou využívány celkem čtyři typy metadat – metadata popisná, technická, metadata o právech a o původu. V rámci výzkumných a vývojových aktivit byl vytvořen prototyp modulárního systému SPER (System for the Preservation of Electronic Resources).

Rozšiřování digitální knihovny pro humanitní vědy: Hudební odkazy v Cervantesových dílech
[Expanding Humanities Digital Library: Musical References in Cervantes’ Works]
Manas Singh, Richard Furuta, Eduardo Urbina, Neal Audenaert, Jie Deng, Carlos Monroy

Projekt Cervantes [17] je zaměřen na vytváření online zdrojů o životě a díle Miguela de Cervantese Saavedry, autora Dona Quijota. Je orientován primárně na text; jeho výsledky nejsou určeny pouze jedné cílové skupině, nýbrž řadě různých uživatelů. V projektu jsou také zahrnuty různé typy dokumentů. Příspěvek byl zaměřen na přítomnost a vliv hudby v Cervantesových dílech. Při vývoji systému byl brán zřetel mj. na typ uživatelských interakcí, které mají být podporovány, na typ informací a jejich vzájemné provázání a následně na způsob jejich prezentace uživatelům. Systém disponuje dvěma rozhraními – jedno je určeno pro správce (editory), druhé je určeno pro samotné uživatele. Vzájemné propojování informací je zatím založeno na porovnávání textových řetězců, probíhá však také průzkum dalších možností propojování.

Budování digitálních knihoven pro vědecká data: Průzkumná studie praxe při práci s daty v ekologii biotopu
[Building Digital Libraries for Scientific Data: An exploratory study of data practices in habitat ecology]
Christine Borgman, Jilian Wallis, Noel Enyedy

[18]

Christine Borgman

Digitální knihovny se v oblasti vědy stávají stále významnějšími. Aby však byly vybaveny vhodnými nástroji a nabízely vhodné služby, je nezbytné porozumět tomu, jak vědci pracují s daty. Příspěvek byl případovou studií, v níž byly přiblíženy zvyklosti ekologů a dalších účastníků z Centra pro zabudované síťové snímání (Center for Embedded Networked Sensing). Bylo zjištěno, že tito vědci jsou ochotnější sdílet data, která již publikovali, než data, která se teprve chystají zveřejnit. Jsou také ochotnější sdílet data získaná z přístrojů než data získaná ručně. Vědci také často předem nejsou schopni specifikovat, která data budou sbírat; často také potřebují zachytit data, která jim umožnují zasadit výsledky do příslušného kontextu. Při sdílení dat také narážejí na problém spočívající v samotné podstatě dat – k jejich interpretaci je potřeba disponovat tacitními znalostmi.

Sekce 6: Metodologie

Navrhovanie zdrojov digitálnych knižníc pre používateľov v rozptýlených, neviazaných sociálnych sieťach
[Designing Digital Library Resources for Users in Sparse, Unbounded Social Networks]
Richard Butterworth

Väčšina publikovaných projektov digitálnych knižníc je zameraná na jednotné, previazané používateľské skupiny, akými sú študenti či výskumné tímy, akademici. Tvorcovia digitálnych knižníc určených uvedeným používateľským skupinám môžu využívať existujúce metódy dizajnu na výber, zhromaždenie a implementáciu požiadaviek týchto skupín. Používateľov imaginárnej digitálnej knižnice v prípade akademickej obce („profesionálov“) možno charakterizovať ako presne zadefinovanú používateľskú skupinu so známymi, predpovedateľnými potrebami a požiadavkami, samotní používatelia sú v rámci akademickej obce ľahko lokalizovateľní a prístupní, ich požiadavky sú homogénne, jednotlivci sú v rámci bádateľskej skupiny vysoko previazaní.

Príspevok Richarda Butterwortha sa však venoval prípadom (ktoré sa v praxi ukázali ako častejšie), kedy sú zdroje v digitálnych knižniciach určené pre rozptýlenejšie, zle definovateľné, vopred neznáme siete používateľov, takzvaných „personal history“ bádateľov.

Projekt The Accessing our Archival and Manuscript Heritage Project (AAMH) je explicitne upriamený na „široký prístup“ k terciárnym vzdelávacím zdrojom a na používateľov mimo vyššieho vzdelávania. Práve pri amatérskych bádateľoch sú potencionálni používatelia digitálnej knižnice len voľne ohraničení, ich potreby a požiadavky nie sú dostatočne zadefinované. Prístup k takémuto používateľovi je zložitý, pretože je zároveň ťažko lokalizovateľný. Samotné požiadavky sú extrémne heterogénne, používatelia nie sú dostatočne vzájomne prepojení, sú iba v príležitostnom kontakte.

Viac informácií o 14mesačnom projekte Londýnskej univerzity AAMH nájdete na adrese http://www.cs.mdx.ac.uk/research/idc/tech_reports.html [19].

Dizajn a výberové kritériá pre národný webový archív
[Design and Selection Criteria for a National Web Archive]
Daniel Gomes, Sérgio Freitas, Mário J. Silva

Web archívy a digitálne knižnice sú koncepčne podobné systémy, keďže zhromažďujú digitálny obsah a poskytujú k nemu prístup. Proces nahrávania dokumentov do digitálnej knižnice obvykle vyžaduje silný zásah zo strany expertov. Na druhú stranu, obsiahle zbierky dokumentov zbierané z webu musia byť do systému nahrávané bez ľudského zásahu. Príspevok portugalského kolektívu autorov analyzoval stratégie na výber obsahu pre národný webový archív a navrhol systémovú architektúru na podporu zberu.

Prototyp web archívu Tomba bol vyvinutý na Lisabonskej univerzite, zohľadňuje danosti portugalského webu ale aj technické možnosti zberu. V novom archíve bolo testovaných 57 mil. dokumentov (1,5 TB) zozbieraných z portugalského webu počas posledných štyroch rokov, skúmané boli tri rozdielne metódy prístupu. Na základe predchádzajúcich analýz domény .pt a portugalského webu mimo národnej domény (čo tvorí až 49 % portugalského webu) zároveň stanovili základné výberové kritériá pre zber webu. Následne popísali architektúru informačného systému, ktorý spĺňa požiadavky archivácie webu. Štyri základné komponenty Tomba sú Gatherer (zberač), Repository (archív), Preserver (ochranca) a Searcher (vyhľadávač). Uvedená adresa stránky prototypu archívu je žiaľ, nefunkčná. (http://tomba.tumba.pt/tumba/tomba/index_en.html [20]; http://tomba.tumba.pt/ [21]) Možno je to spôsobené aj tým, že v Portugalsku tak ako v mnohých ďalších krajinách neexistuje legislatívne zázemie na archiváciu webu. Zároveň ani univerzita na zber a spätné sprístupnenie jednotlivých stránok nemá od tvorcov stránok povolenie. V prípade žiadosti autora stránky ju z archívu musia odstrániť.

Čo je úspešná digitálna knižnica?
[What is a Succesfull Digital Library?]
Rao Shen, Naga Srinivas Vemuri, Weiugo Fan, Edward A. Fox

Mnoho rokov výskumníci z viacerých disciplín študovali rôzne perspektívy úspechu digitálnej knižnice, vytvorili mnoho zaujímavých avšak izolovaných zistení. Dva základné pohľady na hodnotenie kvality digitálnej knižnice sú buď z hľadiska spokojnosti používateľa alebo modelu akceptácie technológie.

Syntézou rôznych výskumov – v oblasti modelov kvality digitálnych knižníc, modelov úspechu a adopčných modelov informačných systémov, modelov používateľského správania pri vyhľadávaní informácií – autori príspevku prezentovali integrovanejší pohľad konceptu úspešnej digitálnej knižnice. Takáto multiteoretická perspektíva, zahŕňajúca účasť používateľskej komunity počas vývojového cyklu digitálnej knižnice, podporuje chápanie sociálnych aspektov digitálnych knižníc a meniace sa potreby používateľov pracujúcich s digitálnou knižnicou. Zároveň pomáha v určovaní, kedy a ako merať kvalitu a ako zabrániť potenciálnym problémom s kvalitou.

Prípadová štúdia digitálnej knižnice pre oblasť archeológie – ETANA – bola vytvorená v spolupráci s 11 archeológmi. Pri tvorbe úspešnej knižnice autori vychádzali zo štyroch základných požiadaviek – informačná kvalita (information quality), systémová kvalita (system quality), očakávaný výkon (performance expectancy), sociálny vplyv (social influence). Používateľské hodnotenie kvality digitálnej knižnice je veľmi subjektívne a emocionálne, úspech každej digitálnej knižnice preto závisí aj od oblasti, ktorou sa zaoberá a koncového používateľa, pre ktorého je určená a ktorý s ňou pracuje.

Viacej informácií o digitálnej knižnici ETANA nájdete na http://feathers.dlib.vt.edu/ [22] alebo http://feathers.dlib.vt.edu:8080/etana/servlet/Start [23].

Sekce 7: Metadata

Evaluace metadatových standardů v kontextu digitálních audiovizuálních knihoven
[Evaluation of Metadata Standards in the Context of Digital Audio-Visual Libraries]
Robbie De Sutter, Stijn Notebaert, Rik Van de Walle

Prvním příspěvkem v sekci Metadata byl belgickými autory nazván Evaluation of Metadata Standards in the Context of Digital Audio-Visual Libraries. Tento příspěvek byl zaměřený na problematiku přeměny audiovizuálních archivů do podoby digitálních knihoven a byl zaměřen především na problematiku metadatových standardů v této oblasti. Autoři navrhli sadu čtyř kritérií, pomocí kterých je možné zhodnotit a porovnat různé metadatové standardy a díky tomu zvolit ty nejvhodnější pro daný projekt. Těmito kritérii jsou interní versus výměnný model, plochý versus hierarchický model, podporované typy metadat a syntaxe a sémantika modelu. Kritéria jsou pak aplikována na čtyři známé metadatové standardy: Dublin Core, Multimedia Content Description Interface (známý též jako MPEG-7), P/Meta a Standard Media Exchange Framework (SMEF).

O problému zjišťování kvality geografických metadat
[On the Problem of Identifying the Quality of Geographic Metadata]
Rafael Tolosana-Calasanz, José A. Álvarez-Robles, Javier Lacasta, Javier Nogueras-Iso, Pedro R. Muro-Medrano, F. Javier Zarazaga-Soria

Jak již název napovídá, byl příspěvek zaměřen na kvalitu geografických metadat a první výsledky pokusů o vyvinutí kvantitativních metod jejího zjišťování. Autoři nejprve požádali skupinu expertů z oboru, aby stanovili kritéria pro stanovení kvality geografických metadat. K takto získaným kritériím se pak pokusili přiřadit kvantitativní ukazatele a ty pak získat pro vzorové sady metadat. Statistickou analýzou pak zjistili, která kritéria největší měrou korelují s kvalitou geografických metadat. Konečným výsledkem výzkumu by pak mohlo být vylepšení algoritmů pro řazení výsledků hledání podle relevance.

Řízení kvality metadat: Případ UNIMARCu
[Quality Control of Metadata: A Case with UNIMARC]
Hugo Manguinhas, José Borbinha

Posledním příspěvkem sekce Metadata pak byla přednáška portugalských autorů Quality Control of Metadata: A Case with UNIMARC. Autoři z portugalské Národní knihovny vytvořili systém umožňující pomocí prostředků XML (XML Schema) kontrolovat kvalitu záznamů ve formátu UNIMARC. K tomuto účelu definovali vlastní sémantiku pro popis formátů z rodiny UNIMARCu. Samotný proces kontroly kvality sestává z fází validace záznamů, filtrování záznamů podle typů chyb a náročnosti jejich opravy, dále z fáze vytváření zpráv a nakonec z fáze oprav. Popsaný systém je dostupný pod názvem MANGAS jednak jako samostatný systém a jednak jako webová služba na adrese http://diag.porbase.org/ [24]. Nástroj je určen především pro budování portugalského souborného katalogu, zajišťuje i každodenní kontrolu změněných záznamů, přičemž nachází chyby v cca 60 % záznamů s průměrnou chybovostí 1,67 chyby na záznam.

Sekce 8: Evaluace

Rozsáhlý dopad služeb digitální knihovny: zjištění z hlavní evaluace SCRAN
[Large-scale impact of digital library services: findings from a major evaluation of SCRAN]
Gobinda Chowdhury, David McMenemy, Allan Poulter

V příspěvku byl nejprve stručně představen projekt SCRAN [25] (Scottish Cultural Resources Access Network), jehož počátky sahají do roku 1996. Původně byl vytvořen pro žáky škol, později byl však zpřístupněn široké veřejnosti. Dále byly zachyceny výsledky evaluace služby SCRAN, která byla díky Skotské radě pro knihovny a informace (Scottish Library and Information Council, SLIC) pro veřejné knihovny ve Skotsku zpřístupněna na rok zdarma. Jednu z problematických částí evaluace představovala interpretace transakčních logů, protože ve veřejných knihovnách se u konkrétních počítačů střídají jednotliví uživatelé (z hlediska systému však nejsou vzájemně odlišitelní). Velmi podstatné jsou také diskuze týkající se obchodního modelu systému SCRAN – existuje rozpor mezi očekáváním, že obsah bude poskytován zdarma, a mezi představou, že systém bude fungovat na komerční bázi.

Logovací schéma pro komparativní hodnocení digitálních knihoven
[A Logging Scheme for Comparative Digital Library Evaluation]
Claus-Peter Klas, Hanne Albrechtsen, Norbert Fuhr, Preben Hansen, Elin Jacob, Laszlo Kovacs, Sascha Kriewel, Sarantos Kapidakis, Andras Micsik

V příspěvku byl prezentován experimentální návrh rámce pro hodnocení digitálních knihoven DAFFODIL [26]. Interakce mezi uživatelem a systémem může být zkoumána a zachycována z různých hledisek (parametry systému, samotná interakce mezi uživatelem a systémem a chování uživatele – to však nemůže nikdy být zcela přesně zachyceno). Pro tento účel zatím dosud nebyly k dispozici standardní nástroje.

Evaluace relevance a rozšiřování poznatků při vyhledávání v diskuzích
[Evaluation of Relevance and Knowledge Augmentation in Discussion Search]
Ingo Frommholz, Norbert Fuhr

Vyhledávání v diskuzích prováděné za účelem získání hodnotných informací se zaměřuje na anotace (např. v rámci blogů či wiki) a komentáře relevantní dotazu. Vyhledávací metody mohou využívat řady kontextových informací vyplývajících ze struktury řetězce diskuze. Při vyhledávání mohou být uplatněny dva přístupy, resp. strategie – rozšiřování poznatků (knowledge augmentation) a rozšiřování relevance (relevance augmentation). Bylo zjištěno, že zejména rozšiřování poznatků, které využívá zvýraznění citátů a uvádění jejich kontextu, zvyšuje efektivitu vyhledávání.

Sekce 9: Studia uživatelů

Vytváření uživatelského rozhraní pro interaktivní vyhledávání strukturovaných dokumentů – poučení z interaktivní cesty INEX
[Designing a User Interface for Interactive Retrieval of Structured Documents - Lessons Learned from the INEX Interactive Track]
Saadia Malik, Claus-Peter Klas, Norbert Fuhr, Birger Larsen, Anastasios Tombros

Příspěvek se zabývá otázkou použitelnosti (usability) webových rozhraní pro uživatele v rámci iniciativy INEX (Initiative for the Evaluation of XML Retrieval). Autoři konstatují, že díky analýze některých negativních reakcí na testované webové rozhraní (např. nedostatečná shrnutí, která by umožnila lépe posoudit relevanci dané položky, či nerozlišování mezi navštívenými a nenavštívenými položkami) se jim podařilo uživatelské rozhraní výrazně vylepšit.

Průzkumný přístup k porozumění tvorbě funkcí systému pro akademická výuková prostředí za pomoci faktorové analýzy
[An Exploratory Factor Analytic Approach to Understand Design Features for Academic Learning Environments]
Shu-Shing Lee, Yin-Leng Theng, Hoe-Lian Goh, Schubert Shou-Boon Foo

Autoři příspěvku pracují s tzv. subjektivní relevancí, kterou definují jako užitečnost dokumentu pro splnění určitého úkolu. Provedli kvantitativní výzkum, jejímž cílem bylo zjistit, jak studenti vnímají funkce podporující subjektivní hodnocení relevance dokumentů ve vyhledávacím systému. Při průzkumu však studenti nepoužívali konkrétní vyhledávací systém. Bylo zjištěno, že by uvítali prezentaci kontextu vyhledaných prvků v seznamu výsledků, eliminaci vzájemného překrytí v seznamech výsledků, uvedení obsahu dokumentu při zobrazování výsledků a zvýraznění vyhledávaných slov. Otázkou zůstává, zda by tyto výsledky byly též validní v dalších digitálních zdrojích, např. ve Wikipedii.

Stále sbírám: Studenti vytvářejí a využívají sbírky i navzdory selháním
["I Keep Collecting": College students Build and Utilize Collections in Spite of Breakdowns]
Eunyee Koh, Andruid Kerne

Andruid Kerne ve svém vystoupení představil výsledky průzkumu týkajícího se shromažďování digitálních informací provedeného na vzorku dvaceti studentů. Bylo zjištěno, že během vytváření sbírek digitálních informací respondenti vnímají jako problém správu a využitelnost sbírky, a to zejména v okamžiku, kdy sbírky nabývají na objemu a zvyšuje se jejich počet. Přes tato úskalí studenti stále informace shromažďují a snaží si vypomáhat např. vytvářením metadat či hierarchických struktur.

Sekce 10: Modelování

Reprezentace informací v kontextu v NSDL
[Representing Contextualized Information in the NSDL]
Carl Lagoze, Dean Krafft, Tim Cornwell, Dean Eckstrom, Susan Jesuroga, and Chris Wilper

National Science Digital Library byla založena NSF za účelem podpory vědeckého a matematického vzdělávání. Prvotním „produktem” byla digitální knihovna založená na metadatech a umožňující vyhledávání a přístup do distribuovaných zdrojů. Tato tehdejší aktivita ukázala, jakou důležitost má kontext – vztahy, metadata, anotace – pro to, aby digitální knihovna měla pedagogickou „cenu”. Nová architektura využívá nástroj Fedora, který slouží pro zpřístupňování komplexního kontextu, dat, metadat, webových služeb a sémantických vztahů jako základna pro „nadstavbu” informačních sítí (INO). INO poskytují rozsáhlou znalostní bázi pro stále se rozšiřující služby digitálních knihoven. Na projekt je vyčleněno 20 milionů USD ročně. NSDL 2.0 vytváří komunitu, nástroje pro strukturalizaci, ohodnocení, anotace, spolupráci a možnost přispívání. V repozitáři/sbírkách jsou různé typy digitálních objektů, metadata, vyčleněné sbírky. Vztahy v repozitáři jsou lokální (jednotlivé objekty) nebo externí (digitální objekt v repozitáři a jiný na internetu). Mají dva miliony zdrojů a 200 milionů vztahů mezi nimi. NSDL je vlastně podle slov autorů nový pohled na vědecké informace na internetu.

K digitální knihovně pro učení jazyků
[Towards a Digital Library for Language Learning]
Shaoqun Wu, Ian H. Witten

Digitální knihovny nevyužily svůj potenciál pro podporu výuky a učení se jazyků. Ačkoliv internet ve své šíři je velmi často používán pro výuku jazyků, má tento způsob kritické nedostatky až nevýhody, které mohou být překonány pomocí více kontrolovaného prostředí. Příspěvek popisoval digitální knihovnu pro výuku jazyků spolu s novou sadou metadat, kterou charakterizují lingvistické formy vyučované během výuky a zároveň také textové atributy (znaky, vlastnosti) využívané pro výběr vhodného výukového materiálu. Nad systémem je postavena sada osmi výukových aktivit, které dohromady nabízejí „výukový prostor” učebny i samostudium spolu s bohatým výběrem interaktivních cvičení, která jsou automaticky generována z obsahu digitální knihovny. Systém byl ověřen a zkoušen experty, učiteli jazyků i studenty.

Za digitálními inkunábulemi: Modelování další generace digitálních knihoven
[Beyond Digital Incunabula: Modeling the Next Generation of Digital Libraries]
Gregory Crane, David Bamman, Lisa Cerrato, Alison Jones, David Mimno, Adrian Packel, David Sculley, Gabriel Weaver

Příspěvek se zabýval několika pohledy na pojem inkunábule, které vnutili prvním digitálním knihovnám omezení tohoto pojmu podle tisku, a přináší argumenty pro designovou strategii zaměřenou na poskytování služeb personalizovaných nebo přizpůsobených potřebám uživatele, které jdou až za omezující model distribuce tisků, založenou na službách a zkušenostech vyvinutých pro řecko-římskou kolekci v Digitální knihovně Perseus. Podle autorů charakterizují design úspěšné digitální knihovny tři vlastnosti: jemné členění objektů sbírky, automatizované procesy a příspěvky z decentralizované komunity. Digitální knihovny mají na rozdíl od těch klasických nové paradigma, zahrnující např. nekonečnou interakci v reálném čase (všech zúčastněných – tj. autorů, čtenářů i vydavatelů).

Sekce 11: Audiovizuální obsah

Správa a vyhledávání videa v digitální knihovně podle sémantiky
[Managing and Querying Video by Semantics in Digital Library]
Yu Wang, Chunxiao Xing, and Lizhu Zhou

Tento příspěvek nebyl na konferenci přednesen, jeho text je však obsažen ve sborníku. Autoři v něm konstatují, že doposud většina systémů pro digitální knihovny nabízí pouze možnost vyhledávání videí na základě metadat. Navrhují proto model Sem TTE a dotazovací jazyk VSQL, který by měl uživatelům umožnit komfortnější vyhledávání na základě videa samotného.

Využití MILOSu k vybudování aplikace multimediální digitální knihovny: Zkušenost s aplikací PhotoBook
[Using MILOS to Build a Multimedia Digital Library Application: The PhotoBook Experience]
Giuseppe Amato, Paolo Bolettieri, Franca Debole, Fabrizio Falchi, Fausto Rabitti, Pasquale Savino

Pole digitálních knihoven v poslední době rozšiřuje svůj záběr v míře použitelnosti a digitální knihovny se stále průběžně adaptují na časté potřeby změn vycházející z internetové komunity. V souladu s tím se digitální knihovny pomalu mění z kontrolovaného prostředí přístupného pouze profesionálům a expertům na prostředí přístupné obyčejným uživatelům, kteří chtějí využít nabízený potenciál. Digitální knihovny by měly být i pro nezkušené uživatele. Tento nový trend předpokládá např. nabídku nového paradigmatu vyhledávání, nabídku obsahu z nových medií a nový postup automatické extrakce popisných údajů. Budování aplikací digitálních knihoven a jejich efektivní adaptace na nově objevující se trendy vyžaduje vývoj platformy, která nabídne standardní a mocné stavební kameny k podpoře vývojářů aplikací. V příspěvku byly popsány zkušenosti s užíváním systému MILOS, systému pro správu multimediálního obsahu orientovaného na vytváření digitálních knihoven, k výstavbě náročné aplikace věnované neprofesionálním uživatelům. Konkrétně se hovořilo o designu a implementaci online fotoalba (PhotoBook), které je aplikací digitální knihovny umožňující lidem organizovat jejich fotografie, sdílet je s přáteli, poskytovat k nim přístup veřejnosti s možností vyhledávání. PhotoBook využívá komplexní interní metadatové schéma (MPEG-7) a dovoluje uživatelům jednoduše vyjádřit složité dotazy (kombinace similarity search a hledání v polích), dovoluje také vyhledávat materiál i tehdy, pokud metadata jsou nedokonalá nebo chybějí. Pro porovnání - např. oblíbený Flickr má metadata velmi špatná, pouze formou většinou nesrozumitelných tagů, které slouží spíše k identifikaci vlastních obrázků než k vyhledávání v nich.

Průzkum časových a prostorových omezení kontextuálních informací v testovacích rozhraních založených na obrázcích
[An Exploration of Space-Time Constraints on Contextual Information in Image-Based Testing Interfaces]
Unmil Karadkar, Marlo Nordt, Richard Furuta, Cody Lee, Christopher Quick

Rozhraní sbírek digitálních obrázků jsou z hlediska stupně obsahu kontextuálních informací, které poskytuje svým uživatelům a tak jim umožňuje vykonávat jisté úkoly, velmi různorodá. Autoři prezentovali jejich projekt „hledání” technik, jak prezentovat obrázky tak, aby byla podpořena schopnost rozpoznávat určité znaky na obrázcích (tady konkrétně v problematice výzkumů a výuky kardiovaskulárních systémů - studie fotografií žil a cév v netopýřích křídlech). Aby pochopili efekt prezentace obrazů na uživatele, podnikli autoři experimentální zkoušení tří způsobů prezentace. Způsoby se lišily prostorovou a časovou prezentací obrázků, což poskytovalo jiné kontextové informace testovaným subjektům. Výsledek ukázal, že stupeň kontextové informace poskytnuté v prezentaci ovlivňuje schopnost uživatele stejně jako jejich konkrétní vědecké znalosti. Informace se dají využít pro vytváření různých vhodných rozhraní pro trénink vědců „nováčků”, tedy studentů.

Sekce 12: Jazykové technologie

Začlenění vztahů mezi větami v různých dokumentech do sumarizací jednotlivých dokumentů
[Incorporating Cross-Document Relationships Between Sentences for Single Document Summarizations]
Xiaojun Wan, Jianwu Yang, Jianguo Xiao

Textová sumarizace je proces, při kterém se automaticky vytváří komprimovaná verze daného textu schopná poskytnout uživatelům užitečné informace. Tento proces je stále častěji využíván, například vyhledávací stroje v současnosti nabízejí stručný výtah z každého zdroje zobrazeného ve výsledcích. Nedávno byl na základě grafů navržen hodnotící algoritmus využitelný pro sumarizaci jednotlivých dokumentů. Tento algoritmus vyhodnocuje důležitost jednotlivých vět rekurzivním porovnáním vztahů mezi větami v daném dokumentu. Autoři příspěvku se zabývali zkoumáním přínosu využití informací o vztahu k dalším příbuzným a relevantním dokumentům pro sumarizaci jednotlivých dokumentů, založeném na využití hodnotících algoritmů na základě grafů. Výsledky jejich výzkumu ukazují, že tento přístup může výrazně vylepšit a zefektivnit sumarizaci jednotlivých dokumentů.

Efektivní sledování obsahu digitálních knihoven s ohledem na dodržování práv k digitálním dokumentům
[Effective Content Tracking for Digital Rights Management in Digital Libraries]
Jen-Hao Hsiao, Cheng-Hung Li, Chih-Yi Chiu, Jenq-Haur Wang, Chu-Song Chen, Lee-Feng Chien

Mezi běžné způsoby ochrany obsahu digitálních knihoven patří digitální „vodoznaky“ a zajištění kontroly přístupu k dokumentům dle příslušných práv. Tyto metody však mají své limity. Vodoznaky mohou být odstraněny dalším zpracováním digitálních dokumentů a chráněný přístup může být napaden hackery. Autoři příspěvku představili efektivní mechanismus na detekci velmi blízce se shodujícího obsahu digitálních multimediálních dokumentů na internetu jako další linii ochrany práv k těmto dokumentům.

Využití technik sémantického webu pro vícenásobné zobrazení heterogenních sbírek
[Semantic Web Techniques for Multiple Views on Heterogeneous Collections]
Marjolein van Gendt, Antoine Isaac, Lourens van der Meij, Stefan Schlobach

Integrovaný digitální přístup k četným sbírkám patří mezi hlavní otázky, které řeší instituce pečující o kulturní dědictví. Při popisování rozdílných sbírek je nutná interoperabilita metadat. K tomu je potřeba vytvořit řízené hesláře pro popis objektů v těchto sbírkách. Autoři příspěvku prezentovali experiment, při kterém zkombinovali hesláře dvou sbírek aplikováním technik reprezentace znalostí na základě aktuálního výzkumu problematiky sémantického webu. Předvedli kroky, které si tento postup vyžádal – zejména formalizaci vstupních zdrojů na základě jazyků sémantického webu, použití nástrojů na vytváření ontologií a reprezentaci výsledků. Prezentovali prototyp řešení, které umožní uživateli vyhledávat v obou kolekcích, a to při zachování původních struktur heslářů.

Panelová diskuze

Součástí konference byla také panelová diskuze, která byla zaměřena na téma udržitelných digitálních knihoven pro všeobecné využití a kladla si za cíl napomoci překlenout mezeru mezi aktivitami v oblasti výzkumu a vývoje a udržitelnými digitálními knihovnami pro všeobecné využití. V diskuzi přednesli své příspěvky Aziz Abid (UNESCO, Paměť světa [27]), Eric van der Meulen (TEL [28], Evropská knihovna) a Vittore Casarosa (DELOS [29]). Příspěvek původně ohlášeného Steva Griffina (National Science Foundation [30]), který se bohužel nemohl konference osobně zúčastnit, stručně shrnula Ching-chih Chenová (Simmons College [31], Boston, MA, USA), která společně s José Borbinhou (INESC-ID [32], Portugalsko) diskuzi moderovala.

Posterová sekce

V rámci konference byla prezentována řada posterů, jejichž textová podoba je také součástí sborníku. Jedním z témat byl např. nástroj na konverzi záznamů z formátu MARC do FRBR, byla také např. představena Tsunami Digital Library [33].

[34]

Posterová sekce

Workshopy

Sborník z workshopu Digital Library Goes e-Science [35] 2006 (DLSci 2006) je zdarma k dispozici na webu [36] (ve formátu PDF). Podobně jsou dostupné také pracovní poznámky z workshopu Cross Language Evaluation Forum 2006 [37] (CLEF 2006). Z workshopu Networked Knowledge Organization Systems and Services 2006 [38] (NKOS 2006) jsou k dispozici prezentace, podobně je tomu u 1st European Workshop on the use of Digital Object Repository Systems in Digital Libraries (DORSDL) [39]. Z workshopu Learning Object repositories as Digital Libraries: Current challenges [40] (LODL 2006) jsou zveřejněny texty příspěvků, rovněž tak z workshopu Embedding eLearning - critical success factors for institutional change [41] (CSFIC 2006). Dále se uskutečnil ještě 6th International Workshop on Web archiving and Digital Preservation [42] (IWAW 2006).

Tutorialy

V souvislosti s konferencí ECDL se uskutečnilo celkem pět tutorialů. Kromě dvou tutorialů Dagoberta Soergela, které nesly stejný název a jejichž obsah je shrnut níže, se uskutečnily ještě další tři tutorialy:

Úvod do digitálních knihoven (Introduction to (Teaching/Learning about) Digital Libraries) Eduarda A. Foxe,
Přechod digitálních knihoven na distribuované infrastruktury (Bringing Digital Libraries to Distributed Infrastructures) Thomase Risse a Claudie Niederéeové,
a Repozitář Fedora a rámec služby (The Fedora Repository and Service Framework) Sandy Payetteové a Carla Lagoze.

Tezaury a ontológie v digitálnych knižniciach
[Thesauri and ontologies in digital libraries]
Dagobert Soergel

[43]

Dagobert Soergel

Úvodný workshop bol určený každému, kto sa zaoberá predmetovým prístupom (subject access) k digitálnym knižniciam. Bol zároveň mostom pri prezentovaní metód predmetového prístupu pri výuke odborníkov, ktorí k problematike digitálnych knižníc prichádzajú z iných oblastí. Workshop bol pretkaný príkladmi konceptuálnych aj slovníkových problémov, s ktorými sa používatelia potýkajú pri vyhľadávaní v digitálnych knižniciach.

Ukázali sme si, ako môže byť využitý správne štruktúrovaný tezaurus alebo iný vedomostný organizačný systém (KOS) v úlohe vedomostnej bázy pre interfejs pomáhajúci používateľom s objasnením hľadanej témy (napr. browsovaním vo vhodne štruktúrovaných hierarchiách a fazetových analýzach). Dokáže tiež pomôcť nájsť dobré vyhľadávacie termíny (použitím mapovania hľadaných pojmov a rozšírením hľadaných pojmov so zahrnutím synoným a hierarchie).

Dotkli sme sa aj medzidatabázového (cross-database) a medzijazykového (cross-language) vyhľadávania ako samozrejmého rozšírenia týchto funkcií.

Workshop pokryl KOS štruktúry potrebné na podporu funkcií, akými sú: vzťahy pojem-termín na kontrolu slovníka a rozšírenie na synonymá, pojmová štruktúra pre vyjasnenie problematiky (sémantická analýza, fazety a hierarchia) a hierarchické rozšírenie hľadaného pojmu.

Na záver sme si predstavili niekoľko príkladov tezaurov a iných KOS na ilustráciu spomínaných princípov. V praktickom cvičení sme nakoniec vytvorili vlastný tezaurus z vopred zadaných termínov.

Ďalšie informácie a linky k problematike tezaurov, ontológií a organizácie vedomostí nájdete na stránke http://www.dsoergel.com/ [44].

Závěrem

Konference ECDL 2006 byla desátou (a tedy jubilejní) konferencí věnovanou výzkumu a technologiím v oblasti digitálních knihoven. Ukázala, že v současnosti začíná nová etapa budování digitálních knihoven. Stále více se uplatňují principy kontextového vyhledávání informací, vývoj směřuje ke stále inteligentnějším uživatelským rozhraním, a to i díky výzkumu chování uživatelů při vyhledávání informací.

Další ročník konference ECDL se bude konat ve dnech 16.–21. září 2007 v Budapešti. Bližší informace o akci jsou k dispozici na adrese http://www.ecdl2007.org/ [45].

Redakční poznámka: Autorkou fotografií je Linda Skolková.

Klíčová slova:

digitální knihovny [46]

Hodnocení: