Vyjádření distributora systému ALEPH k obsahu článku Otakara Pinkase
Rádi bychom na úvod poděkovali autorovi za pečlivou analýzu vyhledávání pomocí CCL jazyka [4]. Potěšilo nás, že systém ALEPH může sloužit i jako pedagogické prostředí pro vysokoškolské studenty. Vítáme nabídku autora článku a připojujeme naše komentáře k některým jeho zjištěním.
Pravidla vyhledávání pro zacházení se samohláskami a souhláskami nastavuje systémový knihovník. Obvykle se rozhoduje na základě praktického používání systému uživateli a na základě uživatelských návyků, požadavků a preferencí. Mezi uživateli tvoří specifickou kategorii i knihovníci. Současné nastavení v Národní knihovně se řídí výkladem normy ČSN pro řazení: znaky s primárním řadicím významem si při vyhledávání ponechávají původní hodnotu, znaky se sekundárním a terciárním řadicím významem jsou převáděny na základní podobu bez diakritiky.
Pro optimalizaci výkonu systému vyhledávání ve WWW katalogu může systémový knihovník nastavit dva limity – tzv. hit_limit a tzv. prox_limit:
- hit_limit vyřazuje ze hry velké výsledkové množiny (např. je-li nastaven na hodnotu 50000, odmítne zobrazení takových výsledkových množin, kde výsledný počet záznamů je vyšší než 50000 záznamů);
- prox_limit omezuje provádění dotazů, které obsahují znak pro pravostranné nebo levostranné rozšíření a kde výsledný počet slov, která by se měla použít pro vyhledávání, přesahuje uvedenou hodnotu v limitu (např. je-li nastaven na hodnotu 1000, odmítne provedení takových dotazů, kde počet jedinečných slov získaných na základě rozšíření řetězce přesáhne 1000).
Oba limity může systémový knihovník upravovat a sledovat, jak změněné hodnoty ovlivňují chování systému při vyhledávání. Vyhledávání pomocí grafického klienta knihovníka se tyto limity netýkají.
V případě, že jsou v dotazu s rozšířením použity speciální operátory !n nebo %n, tak jejich použití rovněž ovlivňuje celkový počet slov zpracovávaných v rámci daného vyhledávání. Proto je možný různý výsledek u dotazů D9 a D27.
V případě, že je dotaz zaměřen do určitého indexu (např. klíčových slov), může se v něm vyskytovat méně (nebo více) slov než v indexu jiném (např. slov z názvů). To má v důsledku opět vliv na chování systému při vyhledávání slov s rozšířením. Jinak řečeno v „chudším“ indexu se dotaz provede, v "bohatějším" indexu se dotaz neprovede, protože přesáhne hranici limitu prox_limit.
Při formulaci dotazu pro vyhledávání nemá systém ALEPH nastavena omezení na počet operátorů. Existuje však omezení délky dotazu - celý řetězec představující jeden dotaz (včetně operátorů, závorek a vlastního dotazu) nesmí překročit délku 500 znaků.
Na závěr bychom rádi připomenuli, že v článku uvedená zjištění se týkají instalace systému v Národní knihovně ČR, která používá ALEPH 500 ve verzi 14.2.6. Pro úplné ověření chování vyhledávání pomocí CCL jazyka bychom tak doporučili k analýze i novější verzi systému 16.2, která je k dispozici např. na ČVUT (http://aleph.cvut.cz/ [5]).