Chytrá výstřižková služba bez nůžek
Informační agentura Anopress
Na podstatně vyšší úrovni, a ovšem za peníze, své služby poskytuje informační agentura Anopress spol. s r. o. [5], založená v roce 1997 jako dceřinná společnost a. s. PVT [6]. Informační agentura Anopress se zaměřila na poskytování informací publikovaných českými médii. Shromažďuje je ve formě plných textů ve své databázi, která nese název AMID (Anopress Mediální Informační Databanka). Ta je, spolu s výkonným vyhledávacím systémem TOPIC vyvinutým firmou Verity [7], hlavním pilířem, na nichž stojí úspěšnost tohoto specializovaného poskytovatele zveřejněných textů. Je zřejmé, že čím obsáhlejší databáze bude a čím větší šíři periodik obsáhne, tím spíše si ji potenciální zákazník zvolí za zdroj, z něhož bude získávat médii publikované texty.Excerpované zdroje
Média [8] je v tomto případě to správné slovo, neboť do databanky AMID jsou ukládány texty ze zdrojů nejen tištěných, ale také elektronických. Z tištěných médií jde o téměř všechny významné celostátní deníky (s výjimkou Práva a Hospodářských novin) a některé týdeníky. Pozoruhodné je zastoupení regionálních periodik z vydavatelství Deníky Bohemia, kterých je 48 (!), stejně tak jako týdeníky Vydavatelství Region. Z elektronických médií putují do databanky doslovné přepisy významných televizních i rozhlasových zpravodajských a publicistických pořadů. Z Internetu pak kompletní obsah vybraných elektronických časopisů. Zvláštní částí databáze AMID je takzvaná vědomostní báze, která obsahuje encyklopedické a faktografické informace z několika zdrojů. O kvalitě tvorby databáze mnohé napoví i fakt, že články z většiny periodik jsou do databáze zařazeny v den vydání v osm hodin ráno.Dotazovací jazyk
Co databáze obsahuje je samozřejmě velmi důležité. Neméně důležité však je, jak z ní dostat právě to, co nás zajímá. Technologií, která stojí v pozadí úspěšného vyhledávání v takto rozsáhlé databázi, je vyhledávací systém TOPIC [9] firmy Verity. Je to fulltextový rešeršní systém s vlastním dotazovacím jazykem [10] sestávajícím z více než dvaceti operátorů a modifikátorů. Vedle běžných booleovských operátorů obsahuje také fuzzy logiku zastoupenou operátorem ACCRUE a dále několik proximitních operátorů. K dosazování pádových koncovek podstatných a přídavných jmen v zadaném dotazu během vyhledávání slouží operátor STEM. S databází se pracuje zejména prostřednictvím Internetu. Na výběr je několik způsobů. Operativnější, který si lze také volbou volného přístupu zdarma vyzkoušet na omezené části databáze, spočívá ve snadné formulaci dotazu v prostředí WWW. Důležité je, že tento způsob je uživatelsky přátelský a zároveň díky Topicu i velmi účinný. Výsledky vyhledávání se objeví vzápětí po odeslání ve formě seznamu odkazů s přiřazenými hodnotami relevance. Během zadávání dotazu je možné volit z více forem zobrazení výsledku a získaný seznam navíc setřídit podle několika kritérií.Podstatně obtížnější je formulace komplikovaného rozvětveného dotazu, který se nazývá tématický dotaz. V tomto druhu dotazu lze jednotlivým větvím přiřazovat různé míry důležitosti a formulovat i velmi rozsáhlé dotazy, kde v každé z větví mohou být odlišné parametry. Tématický dotaz podle požadavků zákazníka vytvoří v Anopressu na zakázku.