Sémantické vyhledávání je blíže? (Vilém Sklenák)
Vilém Sklenák (Vysoká škola ekonomická v Praze) se zaměřil na současný stav sémantického vyhledávání. Nejprve se věnoval rozšíření internetového prohlížeče Firefox, který je vedle prohlížeče MS Internet Explorer významným hráčem na trhu těchto programů. Firefox je zajímavý díky tomu, že nabízí řadu různých doplňků – je možné je instalovat prostřednictvím Správce doplňků – ten pak směřuje uživatele na webovou adresu http://addons.mozilla.org/ [4]. V. Sklenák zmínil také doplněk nazvaný Googlepedia – mezi výsledky vyhledávání je v druhé části okna zobrazen i záznam z Wikipedie.
Dalším doplňkem je Google Semantics – je užitečný pro tvůrce webu, a to pro účely optimalizace vyhledávání. Funguje tak, že po zadání dotazu do Googlu jsou k dispozici slovní spojení, která souvisejí s dotazem – v podstatě jde o jiný pohled na operátor ~ (tilda), s nímž Google pracuje již delší dobu.
Doplněk Semantifind pochází z dílny stejnojmenné firmy. Je integrován s vyhledáváním pomocí vyhledávačů Google, Yahoo a Live Search. Na příkladu slova Galileo zadaného do vyhledávače Googlu přednášející ukázal, jak doplněk funguje – vyhledávač (formou našeptávání) nabídne různé významy daného slova, uživatel si může vybrat konkrétní význam, který jej zajímá. Důležitá skutečnost je, že vychází z poměrně rozsáhlé ontologie, ta obsahuje více než osm milionů slov (v angličtině), z nich bylo odvozeno 2,3 miliónu konceptů. Do ontologie mohou přispívat i uživatelé, je otevřená.
Doplněk Headup pochází od firmy Semantinet – poskytuje dodatečné informace podle právě zobrazeného obsahu. Instalace je složitější, je potřeba ještě nainstalovat technologii Microsoft Silverlight 2.0. Jako zdroje jsou využívány např. Flickr či Amazon.
V. Sklenák dále přiblížil službu Hakia – je stále ve stádiu betaverze, funguje bez konkrétního omezení (na rozdíl od výše zmíněných doplňků již není vázána na Firefox). Umožňuje např. automatické rozšiřování dotazu o synonyma.
Přednášející upozornil také na propadáky za poslední rok – projekt Wikia Search (pokus Wikipedie konkurovat Googlu) již skončil; projekt Google Knol (pokus Googlu konkurovat Wikipedii) pouze živoří.
Další službou, kterou zmínil V. Sklenák, je služba Powerset, která byla spuštěna v květnu 2008, na podzim již byla koupena firmou Microsoft. Zatím vyhledává ve Wikipedii, nabízí odlišné indexování – jako výsledky vyhledávání jsou vraceny „výtažky“ textu.
V závěru svého vystoupení přednášející konstatoval, že sémantický web se stále vyvíjí, jde však o běh na dlouhou trať. Potvrzuje se, že sémantický web (využívá ontologie) může úspěšně koexistovat s webem 2.0 (využívá tagy). Nedávno byl také potvrzen standard konsorcia W3C „Gleaning Resource Descriptions from Dialects of Languages“ – definuje postupy, jak zkonvertovat mikroformáty do podoby RDF požadované pro sémantický web.
Pro sémantické vyhledávání není jedinou možností sémantický web, ukazuje se, že existují i jiné cesty – ty se dají vzájemně kombinovat, mohou se prolínat.
Zajímavost na závěr: Na začátku května Google rozšířil zobrazení vyhledávání o funkci Show Options (funguje jenom na Google.com, na Google.cz nikoliv). Zadaný dotaz lze rozšířit, doplnit o vhodná klíčová slova, navíc je možné nechat si graficky zobrazit různé významy slov. Během týdne či dvou týdnů by měl být spuštěn nový vyhledávač Microsoftu nazvaný Bing (původní název byl Kumo).
(text konferenčního příspěvku [5])
(ls)