Specializované vyhledávací nástroje pro obor medicína
Doposud jsme se věnovali způsobům, jak se na www dostat k bibliografickým záznamům z medicínských databází a k plným textům článků. Jak však postupovat, chceme-li si ke své problematice vyhledat www stránky? Lze samozřejmě využít velkých vyhledávacích služeb typu Google [4], Fast [5] či AltaVista [6] nebo brouzdat v medicínských sekcích katalogů jako je Yahoo [7]. V případě dobré formulace dotazu se dobereme většinou k celkem relevantním výsledkům.
Můžeme se však také obrátit na vyhledávací služby, které se přímo specializují na medicínu. Z jejich širokého spektra jsem vybrala pět zástupců, kterým bude dnešní sloupek věnován.
MedHunt
Službu MedHunt [8] provozuje Health on the Net Foundation [9], organizace zabývající se mimo jiné také hodnocením kvality medicínských www stránek. Při zadávání dotazu lze zvolit možnosti hledání všech slov, fráze či alespoň jednoho slova z dotazu a dále je k dispozici omezení na určitý typ domény, např. .org či .edu. Prohledávány jsou dvě databáze. První, MedHunt, je vytvářena automaticky s pomocí robota zvaného Marvin [10] (Multi-Agent Retrieval Vagabond on Information Networks), který tak jako jeho kolegové z jiných vyhledávacích služeb obchází web a shromažďuje stránky. S tím rozdílem, že Marvin není všežravec, ale s pomocí rozsáhlého slovníku lékařských termínů loví pouze stránky zaměřené medicínsky. Druhou databází je HONoured Database, která je budována ručně a místo automaticky utvořeného popisu obsahuje krátkou anotaci.
Výsledky vyhledávání jsou řazeny podle skóre relevance, které je vypočteno na základě frekvence výskytu slov z dotazu a jejich pozice v rámci dokumentu (např. v titulku, URL atd.). Barevně jsou odlišeny stránky nalezené v HONoured Database, MedHuntu a stránky, které jsou označeny logem HON Code of Conduct [11], což značí, že se dobrovolně podřizují určitým pravidlům týkajícím se kvality stránek. Každý záznam obsahuje kromě URL, skóre relevance, klíčových slov a popisku také informace o typu domény a datu, kdy byla stránka buď navštívena Marvinem nebo členy HON pracovního týmu, v případě stránek s logem HON datum poslední revize (stránky hlásící se k HON Code of Conduct jsou pravidelně kontrolovány, zda předepsaná pravidla skutečně dodržují).
Kromě vyhledaných záznamů nabízí MedHunt také překlad selekčních termínů do osmi jazyků s následnou možností vyhledání těchto jazykových variant a podle frekvence výskytu v jednotlivých dokumentech zpracuje k vašemu dotazu i příbuzná témata. Jestliže nejsou vyhledány žádné záznamy, je možno vybrat si z klíčových slov s podobným zněním.
HONselect
Sourozencem MedHuntu je HONselect [12], druhá služba Health on the Net Foundation. Ta je založena na vyhledávání dokumentů podle hesel MeSH (Medical Subject Headings). Nabízí celkem tři možnosti, jak se dobrat výsledku. Pokud neznáme MeSH nebo nevíme přesně, co chceme hledat, můžeme prohlížet hierarchický strom MeSH provázaný pomocí hypertextových odkazů, až se dostaneme k žádoucímu termínu. Druhou možností je zadání klíčového slova a vyhledání hesla, které toto slovo obsahuje. Bohužel není možné vyhledávat podle synonym, takže pokud neznáme alespoň přibližné znění hesel, může nám hledání chvíli trvat. A konečně třetí možností jsou tzv. Favourites, abecední seznam nejvyhledávanějších témat.
HONselect ke každému heslu zobrazí celou řadu odkazů na různé zdroje. V prvé řadě je to samotný deskriptorový odstavec MeSH, tedy popis hesla, nadřazené a podřazené termíny a synonyma, z něhož se můžeme pomocí hypertextových odkazů dostat k dalším příbuzným tématům. Dále nabízí předpřipravené rešerše z databáze Medline v systému PubMed [13]. Tyto rešerše jsou sestaveny podle metodiky určené k vyhledávání dokumentů podle principů Evidence Based Medicine, ke každému tématu lze zvolit odkaz na záznamy všech nejnovějších článků, článků o diagnostice, terapii, etiologii a prognóze nebo použít jazykové filtry (němčina, francouzština). Další skupinu odkazů tvoří www zdroje z již zmíněných databází MedHunt a HONoured Database, opět s možností volby jazyka zdroje. Tyto tři části jsou ve výsledku obsaženy vždy, podle charakteru tématu však můžeme navíc ještě obdržet i obrazový materiál, odkazy na novinky v medicíně (zejména u léků) či konference.
Jedná se tedy o velmi komplexní vyhledávací službu, jejíž jedinou nevýhodou je nutnost základní znalosti MeSH. Za to má však stejně jako MedHunt francouzskou [14] a německou [15] verzi rozhraní.
Medical Matrix
Zatímco předcházející dvě služby zahrnovaly jak automaticky vytvářenou databázi, tak ručně budovaný katalog, je Medical Matrix [16] čistým katalogem. Neobsahuje tím pádem tolik odkazů, má nicméně jinou výhodu, a sice velmi precizní systém hodnocení kvality stránek, které je pak v záznamu vyjádřeno srozumitelným grafickým způsobem.
Zdroje jsou rozděleny do tematických kategorií ve třech hierarchických úrovních, navíc u každého tématu existuje vnitřní členění podle druhu dokumentu (text, multimédia, odborné periodikum atd.). Kromě prohlížení jednotlivých kategorií lze v katalogu také vyhledávat, jak pomocí jednoduchého tak pokročilého vyhledávání. Oba druhy se však od sebe liší pouze možností omezení vyhledávání na určitý druh dokumentu.
Kromě stručného popisu a hodnocení obsahuje každý záznam také datum vložení do katalogu a datum poslední aktualizace, není však zcela jasné, zda se jedná o aktualizaci záznamu v katalogu či aktualizaci samotné stránky. Bohužel s výjimkou vysvětlení způsobu hodnocení kvality stránek nemá MM žádnou nápovědu.
OMNI
Původně samostatný projekt OMNI [17] je nyní součástí rozsáhlejšího katalogu BIOME [18], věnovanému biovědám, který má celkem pět sekcí. Medicínskou představuje právě OMNI. Také zde procházejí jednotlivé zdroje jakýmsi recenzním řízením a do katalogu jsou zařazeny pouze ty, které splňují předepsaná kritéria. Vybrané stránky jsou indexovány hesly MeSH a je k nim vytvořena stručná anotace.
Katalog můžeme prohledávat za pomoci operátorů AND a OR, případně vyhledávat fráze, nebo prohlížet podle vzájemně provázaných hesel MeSH nebo předmětových hesel National Library of Medicine [19].
Dr. Antonius
Ačkoliv většina medicínských www stránek je v angličtině a totéž platí i o specializovaných vyhledávacích službách, je tu něco pouze pro němčináře, a sice Dr. Antonius [20]. Jeho automaticky tvořená databáze obsahuje v současnosti kolem 88 000 dokumentů. Robot, který pro databázi "sbírá" stránky, využívá pro výběr podobně jako výše zmíněný Marvin slovník medicínských termínů. Tento slovník (v originále X-med Thesaurus, ačkoliv se nejedná o tezaurus v pravém slova smyslu) lze použít i při vyhledávání. Společně s námi zadaným klíčovým slovem pak systém vyhledává i všechna jeho synonyma, která jsou obsažena v X-med tezauru. Kromě toho je možné používat operátory AND, OR, NOT a NEAR.
Výsledky jsou řazeny podle skóre relevance, které se vypočte následujícím způsobem [21]: Každé slovo je "zváženo" podle své frekvence výskytu v dokumentu. Slovu, které se vyskytuje nejméně často, je přiřazena největší váha, naopak slovu s nejvíce výskyty váha nejmenší. Ta je pak násobena počtem výskytů v dokumentu a součet jednotlivých výsledků udává pořadí. Bohužel však není u vysvětlení uveden žádný příklad, takže zůstává mírně nejasné.
U každého dokumentu je uveden název, URL a velikost souboru, žádný další popis, takže pokud se týče relevance jednotlivých stránek, nezbývá nám, než soudit podle názvu a URL, případně se přesvědčit sami.
Závěrem
Všechny zmíněné služby jsou provozovány neziskovými organizacemi, až na drobné výjimky tedy nejsme při jejich využívání zahlcování reklamou a nabídkami různých dalších produktů a služeb. Jsou uživatelsky vlídné, jejich stránky graficky střídmé, navigace jednoduchá. Co jim tedy vytknout? Snad jen to, že se s výjimkou Dr. Antonia u žádné z nich nedovíme aktuální velikost databáze. Lze však předpokládat, že databáze těchto specializovaných služeb obsahují záznamy maximálně stovek tisíc dokumentů, u katalogů je to samozřejmě podstatně méně, navíc u nich existují odlišnosti v geografické i oborové (v rámci biomedicíny) orientaci, takže bychom neměli zůstávat u jedné oblíbenkyně, ale měli bychom jich využívat více. Včetně vyhledávání a katalogů, které jsou součástí velkých medicínských portálů, o nichž si povíme příště.