Sorry, you need to enable JavaScript to visit this website.

Měnící se svět webového vyhledávání

Čas nutný k přečtení
7 minut
Již přečteno

Měnící se svět webového vyhledávání

0 comments
Anglicky
English title: 
The changing world of the web search
English abstract: 
The following article focuses on the workshop INFORUM 2015 which took place on 25th May 2015 in Prague. The workshop was focused on web information retrieval – various search engines including the well-known Google, Bing and Yahoo as well as specialized and non-conventional engines such as Google Scholar and BASE were thoroughly described and discussed.

Workshop věnovaný problematice webového vyhledávání proběhl v pondělí 25. května 2015 v prostorách Akademie věd. Vedla jej Marydee Ojala, rešeršérka a redaktorka časopisu Online Searcher. Nutno dodat, že to nebylo první setkání, účastníci konference už se s ní v roli přednášející mohli setkat během předchozích ročníků konference Inforum.

Marydee Ojala úvodem stručně shrnula různé typy vyhledávačů: univerzální vyhledávače (např. Google, Bing), vyhledávače zaměřené na konkrétní témata (např. zprávy, obchodní informace, lékařské informace), formátově orientované vyhledávače (např. na video, obrázky apod.), vyhledávače zaměřené na výpočty a numerická data (např. Wolfram|Alpha, Zanran), placené vyhledávače (např. Factiva, ProQuest Dialog, LexisNexis, EBSCO, Web of Science aj.) nebo další platformy, např. pro vyhledání publikací v režimu Open Access nebo pro vyhledávání podnikových informací. Připomněla také obecné informace, týkající se webu a webového vyhledání, např. skutečnost, že vyhledávače ve skutečnosti nevyhledávají na celém webu, ale pouze údaje uložené v tzv. indexu (databázi) nebo že při vyhledávání na webu uživatel prohledává nestrukturovaná data (na rozdíl od knihovních či odborných databází). Zmínila také problematiku „page ranku“ jednotlivých webů: uvedla, že v původní filozofii webu byl kladen důraz na odkazy, které – podobně jako sledování citací u odborných článků – měly přispět k hodnocení webu. Dnes už je důraz na tzv. „page rank“ spíše zbytečně přeceňován, protože existuje zhruba dvě stě způsobů hodnocení relevance webu, které však obvykle provozovatelé vyhledávačů nezveřejňují.

V úvodní části byla pozornost věnována také volbě vyhledávacího nástroje. Důležitá je velikost databáze daného vyhledávače nebo to, jak často jsou data v této databázi aktualizována. Podstatné pro využití vyhledávače může být i to, zda a jakým způsobem je umožněno pokročilé vyhledávání. V poslední době se bohužel pokročilé vyhledávání stalo „ohroženým druhem“ – lze vysledovat trend jeho odsunu z hlavní stránky vyhledávače pod různě ukryté nabídky, případně pokročilé vyhledávání zcela mizí. Ve vyhledávačích lze mnohdy využít booleovskou logiku, ale ne vždy tak, jak by „znalý“ uživatel čekal.

Jako příklad zde posloužil vyhledávač Google. Po opakovaném zpřesnění dotazu, kdy by počet výsledků měl logicky klesnout, naopak vzroste. Je to způsobeno tím, že Google pracuje s dvěma indexy a v případě, že zaznamená hlubší zájem uživatele o některé téma, nabídne i druhý index. Ani nabízené proximitní operátory zde nemusí pracovat podle očekávání, použití příkazů AROUND nebo NEAR pouze ovlivní řazení výsledků. Výsledky vyhledávání ovlivňuje i to, ve které zemi vyhledávání probíhá: výsledky téhož vyhledávače mohou být jiné pro evropskou nebo pro americkou verzi; rozpoznání národní verze může např. ovlivnit i taková drobnost, jako je formát telefonního čísla hotelu, ve kterém se uživatel připojí k internetu.

Důležité je také mít na paměti, k čemu vyhledávač vlastně slouží – pro vyhledávání nebo pro reklamu? Nelze zapomínat ani na to, že mnoho stránek, které na webu existují, zůstane pro uživatele ve výsledcích vyhledávání skryto. Jedná se např. o neviditelný (hloubkový) web, stránky, které jsou jejich tvůrci blokovány vůči vyhledávacím robotům, soukromá data, stránky chráněné přístupovými hesly apod. Použitelnost vyhledávačů ovlivňuje také to, jak jsou uspořádány výsledky vyhledávání a jak se s nimi dá dále pracovat, jaké jsou možnosti uživatelského nastavení vyhledávače, jakým způsobem pracuje vyhledávač s reklamou nebo jaké typy stránek jsou do vyhledávání zahrnuty, zda se dají vyhledávat informace v reálném čase apod. Skutečnost, že vyhledávače ukládají naše předchozí hledání a podle nich nám nabízejí další výsledky, nemusí být vždy výhodou. Naopak se může stát, že uživatel je uzavřen do „filtrovací bubliny“ a jsou mu nabízeny jen ty výsledky, které chce slyšet (např. podle politického či jiného přesvědčení).

Pro úspěšné vyhledávání je potřeba dobře formulovat dotaz, zvážit, co má být výstupem apod., zvážit využití anonymního vyhledávání apod. Ačkoli se to může jevit jako samozřejmost, je nutné učit uživatele, aby při vyhledávání zapojili kritické myšlení a přemýšleli, co vlastně může být na webu nalezeno (pravděpodobně to např. nebude video ze 14. století nebo důvěrné bankovní informace).

Další část workshopu byla věnována jednotlivým vyhledávacím službám a aktuálním trendům ve vyhledávání.

Google je dominantním vyhledávačem (s výjimkou některých oblastí, jako je Rusko, Japonsko, Jižní Korea, Čína). Vyhledávání chápe jako interaktivní proces, předpokládá, že lidé nevyužívají pokročilé vyhledávání, že nehledají dokumenty, ale informace. Důraz klade na personalizaci, na sociální, osobní nebo lokální aspekty vyhledávání, neustále mění vyhledávací algoritmy, rozhraní, nabízené služby – některé z nich definitivně mizí (Google Reader, iGoogle, vyhledávání definic pomocí pomoci „define:“ aj.). V poslední době je kladen důraz na Google+ nebo na podporu mobilních zařízení, která má vliv na SEO – ve výsledcích vyhledávání na mobilních zařízeních jsou potlačeny stránky, které nejsou pro tato zařízení optimalizována. Zajímavé jsou aktivity firmy, které s vyhledávání přímo nesouvisejí, např. Google Mapy a StreetView, Google Earth, Cultural institute, Google Glass apod.

Největším konkurentem Googlu je v USA vyhledávač Bing s 20 % podílem na trhu. Nabízí národní verze stránek, snaží se přilákat uživatele denně obměňovanými obrázky na vstupní stránce, dlouhodobě usiluje o zvýšení relevance výsledků oproti Googlu. Zajímavostí je prohledávání v reálném čase (např. Twitter) nebo propojení vyhledávání s dalšími sociálními sítěmi. Uživatel má možnost nastavit si preference pro vyhledávání (ikona na vstupní stránce vyhledávače), je zde významně podporováno našeptávání při vyhledávání. I z vyhledávače Bing však mizí pokročilé vyhledávání. Na rozdíl od Googlu zde změny probíhají v dlouhodobých cyklech spolu s některými dalšími produkty firmy Microsoft, což souvisí i s tím, že Bing je úzce propojen a integrován s Microsoft Office.

Dále přednášející zmínila další vyhledávače, mezi nimi vyhledávač Yahoo. Ten využívá stejnou technologii jako vyhledávač Bing, proto jsou výsledky vyhledávání velmi podobné. Zajímavou alternativou k velkým vyhledávačům je DuckDuckGo, který funguje od roku 2008 a jehož popularita prudce vzrostla v reakci na obavy ze sledování občanů vládou v souvislosti s kauzou Edwarda Snowdena. DuckDuckGo klade důraz na soukromí, neukládá žádná hledání nebo IP adresy, cookies používá pouze tam, kde je to nutné pro nastavení. Nabízí také zajímavé možnosti přizpůsobení vzhledu. Anonymitu nabízí i vyhledávač Yandex, populární především v Rusku. Kromě vyhledávání nabízí webový prohlížeč, e-mailového klienta, hudbu, video aj. Zajímavostí je, že ve výsledcích nejsou na první pohled viditelné přidané reklamy. V některých zemích vedou národní vyhledávače, např. Baidu (Čína), Seznam, Naver (Korea).

Nelze zapomenout na tzv. vertikální vyhledávání, která se zaměřuje na konkrétní typ informací. Jedná se např. o vyhledávání akademických informací, obrázků, zpráv, videí, informací o počasí, finančních informací, vyhledávání v mapách apod. Vertikální vyhledávání nabízejí jak všeobecné vyhledávače (Google, Bing nebo Yahoo), tak i speciální nástroje, např. Biznar nebo http://www.marketsearch.com (obchodní informace), Science.gov, Google Scholar, BASE-Bielefeld Academic Search Engine (vědecké a akademické informace), PubMed, MedNar.com, PatientsLikeMe.com (lékařské a pacientské informace), United Nations (mezinárodní politika), PicSearch.com, TinEye.com (obrázky), již zmíněné vyhledávače Wolfram|Alpha a Zanran (statistiky, výpočty a numerická data) a mnohé další. Do skupiny vertikálních vyhledávačů lze zařadit také nástroje zaměřené na vyhledávání Open Acces dokumentů (Directory of Open Acces Journal, OAISter a další).

Poslední část workshopu byla věnována aktuálním trendům v oblasti vyhledávání: Většina vyhledávačů vylepšuje výsledky vyhledáván „učením se“ z předchozích  dotazů, do oblasti vyhledávání proniká crowdsourcing. Dalšími trendy jsou vyhledávání podle obrázků, hlasové vyhledávání, vyhledávání v reálném čase, provázání vyhledávání se sociálními sítěmi, využívání nejrůznějších kolaborativních metod a sdílení apod. Na závěr Marydee Ojala zdůraznila, že je potřeba být neustále ve střehu, protože svět webového vyhledávání se opravdu neustále mění a informace, které platí dnes, už zítra mohou být zastaralé (což lze ostatně říci i o informacích uvedených v tomto článku).

Hodnocení: 
Průměr: 4 (hlasů: 2)
CERNIŇÁKOVÁ, Eva. Měnící se svět webového vyhledávání. Ikaros [online]. 2015, ročník 19, číslo 6 [cit. 2022-09-27]. urn:nbn:cz:ik-17526. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/17526

automaticky generované reklamy
registration login password