Konference ELPUB 2002
Ve dnech 6.–8. listopadu 2002 se v Karlových Varech konal 6. ročník mezinárodní konference ELPUB o elektronickém publikování, letos s podtitulem Technology Interactions. Pořadateli této konference jsou ICCC [4] (International Council for Computer Communication) a IFIP [5] (International Federation for Information Processing) a její organizaci v tomto roce zajišťoval Institut für Print- und Medientechnik Technické university v Chemnitz [6] ve spolupráci s Katedrou informatiky a výpočetní techniky Západočeské university v Plzni [7]. Jednání probíhalo v prostorách Grandhotelu Pupp [8].
Konference měla přibližně 80 účastníků z osmnácti zemí a během dvou dnů jednání bylo předneseno 40 příspěvků. Až na jednu výjimku jsou všechny příspěvky (včetně dvou posterů) obsaženy ve sborníku [1] (bude k dispozici ve fondu Krajské knihovny Františka Bartoše ve Zlíně [9]), abstrakta jsou též dostupná na webových stránkách ELPUB 2002 [10]. Kromě úvodního a závěrečného plenárního zasedání probíhalo jednání ve dvou paralelních sekcích – všeobecné a technické. Všeobecná sekce byla rozdělena do těchto tematických skupin: eKultura – zkušenosti a očekávání, „staré“ standardy a „nové“ technologie, informace šité na míru uživatelským potřebám a akademické publikování – napínání informačního řetězce. Technická sekce měla tyto části: nové technologie pro digitální knihovny, XML aplikace na poli elektronického publikování, poskytování znalostí – nové přístupy k distančnímu vzdělávání, umělá inteligence, linking, metadata a copyrigth a řízení přístupu.
Tematický rozsah příspěvků byl široký a obsahoval problematiku elektronického publikování od technických aspektů (používání metadat a metadata harvesting, XML aplikace, odkazování apod.) přes otázky vydavatelské a presentační (zejména v akademické sféře, ale např. i v oblasti elektronických novin) až k otázkám copyrightu, budování digitálních knihoven a knowledge managementu (přístupy založené na topic maps a ontologiích, automatická indexace, thesaury, text mining a další). Své zkušenosti, projekty a plány zde prezentovali nakladatelé, programátoři, knihovníci, stručně řečeno jak producenti, tak příjemci elektronických (či elektronizovaných) informací, a to jak z komerčního, tak z akademického prostředí. Výčet všech přednášek by byl dlouhý a vzhledem k jejich obsažnosti by nepostihl obsah v celé hloubce, budou proto zmíněny jen některé.
Úvodním příspěvkem společného jednání bylo vystoupení Jense
Nebeho (empolis) na téma transformace informací v hodnoty (není obsažen
ve sborníku). Shrnul v něm základní teoretická východiska knowledge
managementu (KM) a jeho funkce. Hovořil také o informačním přesycení (information
overload, information glut) a jeho typických příznacích: frustraci („tolik
informací nelze pojmout“), strachu („co, když mi unikne něco důležitého“)
a odtud pramenící neschopnosti jednat a přijímat rozhodnutí. Přehledně
vysvětlil používání topic maps – „GPS informačního vesmíru“ – a
vyhledávání založeného na ontologiích.
Anna Maria Correia (Universidade Nova de Lisboa) se ve svém příspěvku
věnovala problematice informační gramotnosti (information literacy – IL) v
éře elektronického publikování. Pojednala různé dílčí typy
gramotnosti, které jsou nutným předpokladem k dosažení IL, zejména počítačovou
gramotnost (computer literacy), gramotnost ve vztahu k médiím (media literacy)
a gramotnost ve využívání knihoven (library literacy), ale také vizuální
gramotnost a schopnost vizuálního učení. Zdůraznila, že programy
typu ECDL, resp. ICDL (European, resp. International Computer Driving
Licence) jsou sice přínosné, ale nejsou postačující k dosažení IL.
Jednání technické sekce zahájil José Borbinha (National Library of Portugal), který se ve svém příspěvku věnoval problematice digitálního vázání – vytváření digitálních „svazků“ – druhově různých manifestací jednoho (literárního) díla, případně děl souvisejících (osobou autora apod.), a to jak na úrovni digitalizací těchto děl, tak na úrovni bibliografických záznamů jejich hmotných předloh. Tyto digitální svazky jsou vytvářeny na základě modelu FRBR (Functional Requirements for Bibliographic Records) navrženého IFLA a v současné době jich mají v portugalské národní knihovně vytvořeno asi 200.
Ve všeobecné sekci prezentovala Milena Dobreva (Institute of Mathematics
and Computer Science Sofia) projekt elektronického zpřístupnění bulharských
středověkých rukopisů a starých tisků. Motivací jim byla jednak skutečnost,
že jsou fyzicky umístěny v různých knihovnách a archivech po světě,
jednak většinou špatný fyzický stav a z toho pramenící restrikce v přístupu
pro badatele a širokou veřejnost. Praktickým výsledkem tohoto projektu je
např. digitalizace a vydání Eninského Apoštoláře,
vážně poškozeného rukopisu z 11. století.
Peter Linde (Blekinge Institute of Technology Karlskrona) ve své přednášce
představil projekt spolupráce paměťových institucí BETEXT a COVAX, jejichž
náplní je digitalizace dokumentů kulturního dědictví ve formátu XML. V
pilotní části těchto projektů byla za spolupráce Knihovny v Karlskroně,
Muzea v Blekinge, Švédského námořního muzea a Švédského námořnictva
digitalizována dvojice souvisejících historických děl o stavbě lodí:
Architectura Navalis Mercatoria (1786) a Tractat om Skepps Byggeriet (1775)
Frederika af Chapman. Při digitalizaci těchto děl a převodu do formátu XML
bylo použito DTD dle definice TEI (Text Encoding Initiative). V závěru svého
příspěvku Peter Linde zdůraznil, že i přes úspěšný pilotní projekt a
prokazatelné výsledky je velmi těžké přesvědčovat k další spolupráci
paměťové instituce – poskytovatele obsahu, a to zvláště v případě menších
muzeí, knihoven a archivů, které zatím nedocenily přínos nových
technologií pro zpřístupnění svých sbírek.
Carina Ihlström (Halmstad University) a Jonas Lundberg (Linköping University) ve svých navazujících příspěvcích rozebrali problematiku elektronických regionálních novin na příkladě několika švédských vydavatelů publikujících své tituly prostřednictvím společné online gateway. Motivací pro jejich studii je stále menší ochota vydavatelů publikovat elektronické verze svých novin zdarma na webu bez odpovídajících příjmů, které by pokryly rostoucí náklady na tuto činnost. Provedli rozsáhlé statistické šetření mezi čtenáři, zaměřené na demografické, obsahové i technické faktory, ze kterého mimo jiné vyplynulo, že většina čtenářů elektronických verzí novin je chápe jako doplněk k papírové verzi a přistupuje k nim během dne v zaměstnání. Pouze 10% čtenářů by bylo v budoucnu za elektronickou verzi ochotno nějakým způsobem platit.
R. E. Lonsdale (University of Wales) a C. J. Armstrong (Centre for Information Quality Management) se ve svém příspěvku věnovali z knihovnického hlediska zajímavému tématu usnadnění přístupu a vyhledávání elektronických knih v akademickém sektoru. Přiblížili v něm např. problematiku povinného výtisku elektronických publikací v UK. V živé diskusi k tomuto příspěvku se hovořilo např. o tom, jak definovat pojem „elektronická kniha“ (e-book), zda je pro ně účelné používání ISBN a jiných zajímavých tématech. Za účelem mezinárodní výměny informací na toto téma zřídili autoři elektronickou diskusní skupinu s názvem E-book Bibliographic Access (viz http://www.jiscmail.ac.uk/lists/E-BOOK-BIBACCESS.html [11]).
V příspěvku Ursuly Jutzi-Müllerové (ETH Library Switzerland), která referovala o digitální knihovně Švédského federálního technického institutu v Zurichu, se hovořilo např. o otázce uvádění bibliografických záznamů elektronických publikací v katalozích knihoven. Tuto praxi hodnotila na základě zjištěných výsledků jako velmi přínosnou a oceňovanou z hlediska uživatelů, kteří nemusí vyhledávat informace roztříštěné v různých zdrojích.
Druhý den zahájil jednání technické sekce příspěvek Jiřího Hynka
(inSITE) a Karla Ježka (Západočeská univerzita v Plzni), zabývající
se použitím metod text miningu v digitální knihovně. Byly v něm
rozebrány jak teoretické základy (v tomto případě detekce n-tic souvisejících
pojmů za užití lemmatizátoru), tak konkrétní příklady použití např. v
oblasti clusteringu dokumentů do tematických oblastí, či filtraci
spamu pro mailové servery. Prezentovaný systém, který je speciálně zaměřen
na analýzu krátkých textů, má po učící se fázi na dostatečně velkém
vzorku textů výborné vlastnosti a velmi nízkou chybovost.
Projekt OmniPaper [12] představil ve svém
vystoupení Bert Paepen (Katholieke Universiteit Leuven). Jde o systém
integrující geograficky různě rozmístěné a různojazyčné informační
zdroje (v tomto případě elektronické noviny) na internetu do jednoho společného
vyhledávacího rozhraní využívajícího hledání pomocí topic map. Systém
je postaven na XML a využívá některé metody umělé inteligence.
Caterina Caracciolo (University of Amsterdam) referovala ve své přednášce o probíhajícím projektu, který se zabývá zpřístupňováním původně tištěných (paper-born) vědeckých příručkových publikací v elektronické podobě na základě konceptuální hierarchie. Vychází se z faktu, že příručky nebývají čteny lineárně, ale vyhledávají se v nich konkrétní tematické pasáže. Vyhledávací systém založený na ontologii by měl uživateli poskytnout také odkazy na experty v daném oboru a související online zdroje.
Harald Krottmaier (Institute for Information Processing and Computer Supported new Media Graz) hovořil ve svém příspěvku o transkluzi dokumentů. Tato metoda (poprvé zmíněna Tedem Nelsonem v roce 1960) se týká citování dokumentů (zvláště ve vědecké literatuře) a spočívá v nahrazení klasického cut-and-paste postupu, kdy neexistuje „živá“ vazba mezi (potencionálně proměnlivým elektronickým) originálem pasáže v citovaném dokumentu a citujícím dokumentem. Transkluze toto propojení umožňuje a vytváří se navíc obousměrný odkaz nejen z citujícího dokumentu k citovanému, ale i naopak. Realizace popisované metody je technologicky poměrně náročná. Jako příklad použití byl uveden časopis Journal of Universal Computer Science. [13]
Na závěrečném zasedání pozval João Álvaro Carvalho všechny účastníky na příští ročník konference ELPUB [14], která se bude konat ve dnech 25.–28. června 2003 v portugalském Guimarães. Pořadatelem bude Universidade do Minho [15].
Poznámka: v diskusi o podobě příštího sborníku (tištěná / elektronická) několik účastníků vyjádřilo zájem o elektronickou verzi vedle tištěné. Padla však také poznámka o tom, že vlastník autorských práv – vydavatel tištěného sborníku – pravděpodobně nebude s elektronickou verzí souhlasit... :)
1. Elpub 2002 Technology Interactions : proceedings of the 6th International ICCC/IFIP Conference on Electronic Publishing held in Karlovy Vary / Czech Republic 6–8 November, 2002. Eds. João Álvaro Carvalho et al. Berlin : Verlag für Wissenschaft und Forschung, 2002. x, 395 s. Wissenschaftliche Beiträge zur Medientechnik.