Portál Xerxes - nové řešení pro federativní vyhledávání v Knihovně UTB
Úvod
Knihovna UTB ve Zlíně v roce 2008 úspěšně nasadila do svých služeb technologii SFX, která velmi výrazně usnadnila práci uživatelům, a která je nadále velmi úspěšnou a přínosnou pomůckou spojenou s elektronickými informačními zdroji. V další fázi jsme však chtěli nabídnout nástroj, který rovněž značně zvyšuje uživatelský komfort. Možnost vyhledávat ve více relevantních zdrojích najednou je nesporně pro uživatele přínosná a atraktivní. Knihovna UTB nabízí dlouhodobě přístup k velkému množství rozličných elektronických informačních zdrojů a federativní vyhledávač, který by umožnil prohledávání více takovýchto zdrojů najednou, se jevil jako logická možnost. Diskuze na toto téma probíhaly prakticky ihned po úspěšné implementaci technologie SFX. Nakonec se podařilo získat na celý projekt peníze z rozvojového projektu na rok 2010. Vedení UTB ve Zlíně tak dalo jasně najevo, že podpora pokročilých nástrojů, ale i celkové zaměření na elektronické informační zdroje, má stále vysokou prioritu.
Federativní vyhledávače a MetaLib
Technologie pro federativní vyhledávání jsou odborné veřejnosti velmi dobře známy. V poslední době sice více přicházejí do módy technologie založené na centrální indexaci metadat (např. Summon nebo Primo Central), ale ty jsou na trhu prozatím pouze velmi krátkou dobu. Po analýze celkové situace jsme došli k závěru, že kvalitně nastavený federativní vyhledávač je stále značnou pomůckou pro uživatele a při jeho zasazení do atraktivního rozhraní může knihovna přinést kvalitní a hlavně jednotnou platformu pro přístup do všech zdrojů, které uživatelům nabízí. Volba konkrétního produktu byla v tomto případě velmi jednoduchá, protože při systémech, které již knihovna provozuje (zejména SFX), bylo zřejmé, že jejich bezproblémová integrace bude nejlépe možná s další technologií do firmy ExLibris – MetaLibem. Ostatně na bázi kombinace technologií SFX a MetaLib běží dobře známá Jednotná informační brána (JIB).
První fáze implementace
Práce na implementaci započaly na jaře 2010. Tentokráte jsme nemuseli pořizovat nový server pro provozování služby, protože MetaLib může běžet na serveru, který jsme před dvěma lety zakoupili pro SFX. Po nákupu licencí a instalaci proběhlo vyčerpávající školení. Na něm byly probrány veškeré náležitosti ohledně fungování služby, a to jak po stránce technické, tak z hlediska uživatelského. Administrativní rozhraní MetaLibu je však, stejně jako je tomu i u SFX, velmi jednoduché a přehledné, takže správce systému se zde zorientuje poměrně rychle. Nastavení fungování celého MetaLibu není příliš obtížné. Databáze, které budou do federativního vyhledávače zapojeny, jsou vybírány z rozsáhlé znalostní báze a způsoby jejich připojení mohou být různé. Typicky se jedná o využití protokolu Z39.50, avšak některé zdroje mají svůj vlastní typ externího připojení. Samotná aktivace je velmi prostá za situace, kdy producent daného zdroje nevyžaduje žádné autentifikační údaje. V opačném případě je třeba navázat komunikaci a příslušná jména a hesla získat. Je však třeba poznamenat, že producenti jsou na takovéto situace připraveni a téměř bez výjimek reagují velmi promptně. Zapojeny mohou být pochopitelně také lokální zdroje, v našem případě katalog a repozitář závěrečných prací DSpace UTB. Sestavení vyhledávacích skupin z jednotlivých zdrojů je práce pro erudovaného informačního pracovníka. Ten musí dopředu zvážit, které databáze dá dohromady a vůbec pro které obory vytvoří tzv. quicksety (vyhledávací skupiny). Jejich nastavení v systému je poté otázkou několika minut. Stejně tak popis jednotlivých zdrojů a jejich zařazení do tematických kategorií není nijak náročné. Celkové nastavení třídníku je také v kompetenci knihovny. Jak si můžete povšimnout, Jednotná informační brána v tomto případě zvolila metodu konspektu. Na UTB jsme se (i vzhledem k dalšímu technickému řešení přes x-server) rozhodli pro naše interní třídění. Jednou z hlavních funkcí MetaLibu je pak vlastní prostor pro uživatele, kde si může ukládat výsledky a dále s nimi pracovat. Proto je nutné vést databázi uživatelů, což bylo vyřešeno provázáním s univerzitním LDAP. Problematika externích uživatelů, kteří nejsou evidování jako studenti či zaměstnanci UTB byla následně řešena samostatně. V reálu pak celkové nastavení systému probíhalo volným tempem v průběhu prázdnin. Systém v klasickém rozhraní MetaLibu byl prakticky kompletně hotov na začátku září. Z důvodu většího uživatelského komfortu, přidaných služeb a atraktivity interface jsme se však rozhodli, že tuto platformu primárně používat nebudeme.
x-server a Xerxes
Abychom mohli federativní vyhledávač provozovat v uživatelsky přívětivém prostředí, rozhodli jsme se, že zakoupíme technologii x-serveru. Ta umožňuje nasazení MetaLibu do jiného rozhraní, které může přinášet další služby a funkcionality, jež standardní metalibovské rozhraní nepodporuje. Zde nás velmi oslovila platforma Xerxes, která je určena přímo jako nadstavba nad federativní vyhledávač MetaLib. Jedná se o volně dostupné řešení, které vyvíjí David Walker na California State University (http://code.google.com/p/xerxes-portal/ [4]). Xerxes je platforma, která je využívána celosvětově zhruba 40 institucemi, přičemž nejvíce instancí je v domovských Spojených státech. Existují však i instituce v Japonsku, Švédsku, Francii a Austrálii, kde je možno tento systém vidět v praxi. V České republice se tak jedná o vůbec první instanci. Hlavním rysem technologie je její otevřenost, takže do ní lze implementovat celou řadu dalších služeb. Rovněž grafika (kterou jsme si nechali navrhnout profesionálem) je plně v kompetenci instituce, která Xerxes provozuje. Během implementace jsme komunikovali přímo s autorem celého systému, což nám značně ulehčovalo práci. Xerxes funguje jako prezentační vrstva nad Metalibem. Obousměrná komunikace probíhá pomocí XML souborů prostřednictvím x-serveru. Xerxes poté s daty získanými z MetaLibu nadále pracuje a snaží se je převést do přehlednější podoby. Příkladem je automatické rozpoznávání formátu dokumentu, které ve výsledcích MetaLibu chybí, ale Xerxes ji s velkou úspěšností doplňuje. Není překvapením, že autor celého systému David Walker za něj sklidil už celou řadu prestižních cen.
Výhody celkového řešení jsou shrnuty zde: http://code.google.com/p/xerxes-portal/wiki/WhyXerxes [5]
Obr.1: Hlavní stránka portálu Xerxes na UTB ve Zlíně
Finální řešení
Portál Xerxes je v ostré verzi k dispozici zhruba od poloviny října. Kromě profesionálně vyřešené grafické stránky nabízí na základní úrovni možnost vyhledávání ve skupinách zdrojů seřazených podle předmětu nebo formátu. Databáze rozdělené do jednotlivých vyhledávacích skupin jsou ještě dále členěny na základní zdroje a další užitečné zdroje. Uživatel tak má možnost zatrhnout více databází pro vyhledávání (maximálně však 10). Kromě toho existuje také varianta, kdy si uživatel může vytvořit vyhledávací skupinu zcela libovolně podle vlastních představ a potřeb. U vyhledaných výsledků je pak k dispozici standardní možnost jejich zpřesňování pomocí faset (např. autoři, roky vydání, témata, zdrojové časopisy atd.) Xerxes obsahuje také databázi recenzovaných časopisů, takže když se ve výsledcích objeví článek z takovéhoto periodika, je na to uživatel automaticky upozorněn. K dispozici je také indikace jazyka a formátu dokumentu. V případě, že je dostupný plný text, zobrazí se ve výsledcích příslušný odkaz. U každého vyhledaného záznamu je také možnost využívat služeb, které přináší technologie SFX. Přihlášení uživatelé mají možnost záznamy ukládat, popisovat, třídit a dále s nimi pracovat. Samozřejmostí je pro každý záznam automaticky vygenerovaná citace podle normy ČSN ISO 690, možnost exportu bibliografických záznamů do specializovaných citačních manažerů (RefWorks, EndNote, Zotero), jejich odeslání emailem nebo stažení do textového souboru. Důležitým doplňkem celého systému je také technologie bX, která doporučuje příbuzné tituly na základě sofistikovaných statistických analýz. Tato doporučení jsou k dispozici u kompletního zobrazení záznamu. Xerxes slouží nejen jako vyhledávací platforma, ale také jako jakýsi rozcestník do jednotlivých elektronických informačních zdrojů (například v situaci, kdy je do federativního vyhledávače nelze zapojit) a dalších služeb knihovny. Portál je dostupný na adrese http://portal.knihovna.utb.cz [7] a je k dispozici v české a anglické verzi. Všech funkcionalit mohou využívat pouze uživatelé z řad UTB ve Zlíně. Ostatní zájemci se mohou do systému přihlásit v modulu host a pro vyhledávání mají k dispozici pouze volně dostupné databáze. I to však může být velmi přínosné. Ve spolupráci s Krajskou knihovnou Františka Bartoše (KFBZ) byla vytvořena například vyhledávací skupina Zlínské knihovny, v níž je možno prohledávat katalogy Knihovny UTB a KFBZ najednou. Uvedení portálu do provozu provázela masívní informační kampaň, která měla za cíl oslovit všechny cílové skupiny uživatelů.
Obr. 2: Podrobný záznam
Pohled do budoucna
Ačkoliv má již Xerxes za sebou určitou dobu v ostrém provozu, na jeho vývoji a vylepšeních je i nadále třeba pracovat. Ke stěžejním problémům, které je nutno v nejbližší době vyřešit, patří stále ještě problematická indikace plných textů a otázka vzdáleného přístupu (zatím se uživatel musí logovat dvakrát - nejprve do samotného portálu, poté i přes vzdálený přístup, chce-li přistupovat do licencovaného obsahu z domova). V plánu jsou také nové funkce, neboť se jedná o otevřený systém, do kterého lze snadno implementovat další služby. Konkrétně bychom rádi do systému přenášeli obálky knih, nabídli více citačních formátů a v neposlední řadě dodali přehledné materiály, které uživateli ulehčí orientaci v portálu. Ty se zatím tvoří v rámci dalšího velkého projektu realizovaného naší knihovnou – portálem informační výchovy IVA.
Zhodnocení
Ke dnešnímu dni můžeme konstatovat, že projekt implementace federativního vyhledávače do služeb Knihovny UTB proběhl úspěšně. Celou službu je pochopitelně ještě nutno doladit a průběžně pracovat na nových funkcích. Ale již nyní má Xerxes řadu uživatelů a ambice stát se reálnou vstupní bránou do elektronických informačních zdrojů, které Knihovna UTB poskytuje. Na tomto místě je nutné poděkovat všem pracovníkům, kteří se na projektu podíleli, ale i technické podpoře systému MetaLib, kterou zajišťuje v ČR firma Multidata. Její odezva při jakýchkoliv problémech byla vždy rychlá a pohotová. I díky tomu má dnes Knihovna UTB v podobě portálu Xerxes jednotné atraktivní vyhledávací rozhraní s možností dalšího rozvoje.
Poznámka redakce: Text je placenou inzercí společnosti MULTIDATA Praha s.r.o.