Způsoby hodnocení relevance u pokročilých vyhledávacích systémů (Pavel Kocourek)
V krátkém příspěvku se Pavel Kocourek zabýval tzv. "relevance ranking", způsoby hodnocení relevance. Přesnost přitom musíme chápat s ohledem na nalezení "všech relevantních" a zároveň "pouze relevantních" záznamů. Způsoby hodnocení se mohou/měly by se lišit podle toho, jedná-li se o proces vyhledávání nebo řazení nalezených záznamů.
Zmíněny byly následující způsoby:
- ve fázi vyhledávání:
- úplnost (obsah slov z dotazu)
- kontextová evidence (významově podobná slova v dokumentu)
- sémantická vzdálenost (porovnání sémantické úrovně dotazu a dokumentu)
- při řazení:
- blízkost slov (uspořádání v dokumentu)
- hustota nálezu (poměr nalezených slov k délce dokumentu)
- a samozřejmě nezbytné algoritmické vyhodnocení jako součást knowhow každé společnosti.
Na závěr byly nastíněny současné možnosti nalezení relevance na základě statistiky podobnosti pro obraz, video a audio.
(jas)