Sorry, you need to enable JavaScript to visit this website.

Novinky ve světě vyhledávání na webu v roce 2010 (Chris Sherman)

Čas nutný k přečtení
7 minut
Již přečteno

Novinky ve světě vyhledávání na webu v roce 2010 (Chris Sherman)

0 comments
Autoři: 
Rubrika: 

Workshop (resp. přednáška) Chrise Shermana, výkonného editora webového sídla SearchEngineLand.com a ředitele americké konzultační společnosti Searchwise, byl zaměřen na novinky v oblasti webového vyhledávání v roce 2010.

Přednášejícího i účastníky workshopu nejprve uvítal Jiří Kadleček ze společnosti Albertine icome Praha, která workshop uspořádala.

Ch. Sherman na začátek svého vystoupení uvedl, že oblastí vyhledávání informací se zabývá už asi od roku 1994. V posledních dvou letech letech přitom došlo k velkým změnám - zejména se začaly uplatňovat smíšené (angl. blended) či všeobecné (angl. universal) výsledky vyhledávání, kdy jsou do "běžných" výsledků vyhledávání zařazovány výsledky z "newebových" informačních zdrojů. Lze se setkat také s označením vyhledávání 3.0 (angl. Search 3.0).

První vývojový stupeň této řady, tj. vyhledávání 1.0 (angl. Search 1.0), byl založen na využití klíčových slov a booleovské logiky. Jako zajímavost Ch. Sherman uvedl, že vyhledávač Altavista zadané výrazy implicitně spojoval operátorem OR. To pochopitelně znamenalo, že uživatelé získávali neadekvátně vysoký počet výsledků vyhledávání.

Významnou změnu ve vyhledávání – hovoří se již o vyhledávání 2.0 – přinesl vyhledávač Google, který začal používat analýzu odkazů a přisuzoval větší váhu stránkám více odkazovaným z jiných stránek. Výsledky vyhledávání přitom stále tvořil seznam odkazů na webové stránky (bez dalšího rozlišení).

To se postupně díky uplatnění novému pojetí vyhledávání mění – Google začal nabízet panely (angl. tabs), jejichž prostřednictvím lze upřesnit, který typ výsledků vyhledávání nás zajímá (např. obrázky, videa, mapy atd.) – jedná se o tzv. vertikální vyhledávání (angl. vertical search). Panely se zobrazují v levé horní části obrazovky, k jejich zobrazení je však potřeba se v této části obrazovky pohybovat kurzorem. Řada uživatelů si jejich skryté přítomnosti není vědoma či je z jiných důvodů nepoužívá. Vyhledávač Google ovšem i v případě, kdy si uživatel nechá zobrazit všechny výsledky webového vyhledávání, určitým způsobem odlišuje některé typy výsledků (např. obrázky). Souvisí to se skutečností, že Google významně změnil způsob zpracování vyhledávacích dotazů – zatímco dříve používal nástroj pro klasifikaci (tzv. classifier) umožňující dosažení vysoké přesnosti a nízké úplnosti vyhledávání, nyní tento nástroj nepoužívá. Místo toho provádí vyhledávání v indexech různých typů zdrojů (obrázků, videa atd.) a z nich následně skládá výsledný seznam výsledků.

Ch. Sherman také blíže charakterizoval společnost Google – má vedoucí postavení na trhu webového vyhledávání, z původně malé firmy se stala velká společnost. V souvislosti s tím je již více konzervativní – to se projevuje mj. tím, že nové prvky, služby atd. neustále testuje, aby si ověřila reakci uživatelů. Podle Larryho Page, spoluzakladatele Googlu, se původně Google chtěl zaměřovat výhradně na oblast vyhledávání informací, Ch. Shermanovi však nezbylo než konstatovat, že dnes má výrazně širší záběr.

Přednášející účastníkům workshopu také názorně ukázal, jak je možné prostřednictvím Googlu efektivně vyhledávat obrázky. Zatímco dříve bylo možné vyhledávat obrázky s využitím různých filtrů pouze prostřednictvím rozhraní pro pokročilé vyhledávání, nyní jsou tyto možnosti k dispozici rovnou v nabídce zobrazující se dynamicky (s širší či užší nabídkou) v levé části obrazovky s výsledky. Vhodným způsobem, jak odfiltrovat většinu uživateli vytvořeného obsahu, je využít filtr pro vysokou kvalitu.

Ch. Sherman se také věnoval různým službám a projektům společnosti Google. Zmínil např. službu My Library, která uživateli umožňuje vést si přehled o přečtených či právě čtených knihách atd. Je potřeba si však uvědomit, že obsah uživatelovy knihovny je veřejný, pokud si uživatel zpřístupnění nenastaví jinak. Služba Google Fast Flip nabízí vizualizaci novinových zpráv, služba Google News Timeline pak umožňuje sledování vývoje jednotlivých klíčových událostí ve zprávách. Google Trends je název nástroje, jehož prostřednictvím lze zjistit, co lidé po celém světě vyhledávají (do jisté omezené míry je tento nástroj využitelný i např. pro predikci rozšíření chřipky apod.). Služba Google Insights for Search je pak určena pro využití v marketingu ve webových vyhledávačích (angl. Search Engine Marketing, SEM). Prostřednictvím nástroje Google Sidewiki lze anotovat jednotlivé webové stránky (anotace jsou veřejné). Inspirativním projektem může být také Google Public Data Explorer, který v současné době na základě patnácti zdrojů (datových sad) nabízí vizualizované výstupy. Uživatelé plánující itinerář své dovolené jistě ocení službu Google City Tours. Projekt Google Goggles je pak zaměřen na využití obrázků pro vyhledávání (projekt je určen pro uživatele mobilních telefonů s operačním systémem Android). Pro uživatele, které zajímá, jaká data o nich Google sbírá, je k dispozici služba Google Accounts. Po přihlášení (v tomto případě je z důvodu ochrany osobních dat požadováno vždy) je rovněž možné změnit různá nastavení týkající se účtu.

Ch. Sherman také stručně nastínil některé kauzy, které se v souvislosti se společností Google objevily (např. soudní spory týkající se funkce Street View v rámci map či požadavky fotografů, kteří mají svá díla zveřejněna v rámci vyhledávače Google Book Search). Jako velmi podnětný lze hodnotit komentář přednášejícího týkající se skutečného stavu cenzury v Číně – Ch. Sherman doporučil článek The Connection Has Been Reset od Jamese Fallowse z magazínu The Atlantic. Je také podstatné si uvědomit, že Google cenzuruje obsah nejenom v Číně, ale také v dalších zemích. Jako americká společnost, která působí na celosvětovém trhu, se musí potýkat s dodržováním různých zákonů v různých zemích. V této souvislosti lze doplnit, že společnost Google vytvořila přehled požadavků různých vlád týkajících se nároků na poskytnutí dat. Jako pozitivní lze také vnímat možnost využít Google Secure Search – šifrované spojení mezi prohlížečem a Googlem prostřednictvím adresy https://www.google.com/. Protože se jedná o horkou novinku, zatím je tato možnost k dispozici uživatelům v USA, kteří využívají doménu google.com.

Ch. Sherman také zdůraznil, že společnost Google již několikrát přepsala kód svého vyhledávače. Pro poslední přepsání je v Googlu interně používán název Caffeine. Cílem bylo zrychlit odezvu vyhledávače z méně než jedné sekundy na méně než jednu desetinu sekundy.

Kromě Googlu se na poli webových vyhledávačů setkáváme ještě se třemi významnými hráči. Jsou jimi Yahoo!, Bing a Wolfram Alpha.

V případě vyhledávače Yahoo! došlo k zvláštnímu vývoji, kdy nyní Microsoft má na starosti vlastní vyhledávání a původní Yahoo! prodává reklamy. Nabízí pouze omezené výsledky smíšeného vyhledávání.

Vyhledávač Microsoftu původně nesl název MSN Search, později byl změněn na Live Search a nyní se jedná o Bing (v čínštině potom tento výraz znamená "zaručeně spolehlivě odpoví", zlí jazykové tvrdí, že se jedná o zkratku z rekurzivního akronymu "Bing Is Not Google"). Bing je oficiálně nazýván spíše jako rozhodovací stroj (angl. decision engine) než jako vyhledávací stroj (angl. search engine) – lze se domnívat, že se jedná o náznak rozšíření pole působnosti Microsoftu z oblasti automatizace kancelářské práce pomocí programů v kancelářském balíku do oblasti rozhodování. Bing také kategorizuje výsledky vyhledávání; pokouší se rovněž o sémantické vyhledávání, kdy se snaží o porozumění významu dotazu, nepracuje jenom se zadanými klíčovými slovy. Nabízí také mapovou aplikaci, která na rozdíl od desktopové aplikace Google Earth funguje v internetovém prohlížeči.

Vyhledávač (resp. počítačový znalostní stroj) Wolfram Alpha je založen na využití postupně rozšiřovaných datových sad. Uživatelům jako odpověď na otázky nedává odkazy, ale přímo odpovědi na otázky (tím se výrazně odlišuje od konkurenčních vyhledávačů). Řada dotazů je však víceznačných, v těchto případech dotazy vyhodnocuje problematicky.

V další části svého vystoupení se Ch. Sherman věnoval sociálním médiím ve vztahu k vyhledávání. Sociální média hrají v prostředí internetu významnou roli, neboť z celkového času, který globálně tráví uživatelé online, je podle společnosti Morgan Stanley na prvním místě Facebook (16 %), na dalších místech jsou pak YouTube (9 %) a Google (5 %). Google zpracovává přibližně 88 miliard dotazů měsíčně, Twitter 19 miliard, Yahoo 9,4 miliardy a Bing 4,1 miliardy (přibližná data jsou založena na datech společností comScore a Twitter).

Přednášející zmínil ještě řadu dalších zdrojů týkajících se dat o Facebooku, dále nabídl přehled vyhledávačů v reálném čase (angl. real time search engines) a vyhledávačů obrázků a videa. Příslušné odkazy jsou dostupné online formou sdílených záložek. Ch. Sherman také stručně upozornil na rostoucí význam mobilních zařízení ve vztahu k vyhledávání.

Podrobněji se věnoval čtyřem způsobům cílení (angl. targeting) – cílení na zařízení, geografickému, demografickému a behaviorálnímu cílení. Cílení na zařízení momentálně praktikují Google, Microsoft a Yahoo!. Geografické (a jazykové) cílení se většinou děje na úrovni země. S demografickým cílením plně pracuje Microsoft, částečně Yahoo; Google zatím "zkoumá možnosti". Demografické cílení může být problematické v případě sdílených počítačů. Behaviorální cílení je uplatňováno společnostmi Microsoft a Yahoo; Google s ním pracuje pouze v případě reklam, nikoliv již (zatím) ve vyhledávání či službě Gmail.

Cílené reklamy se nemusejí uživatelům zobrazovat – reklamy lze odhlásit v jednotlivých vyhledávačích (např. Google a Yahoo) či hromadně prostřednictvím Network Advertising Initiative.

Ch. Sherman své vystoupení uzavřel konstatováním, že oblast webového vyhledávání je konsolidována, působí v ní několik velkých hráčů a je pravděpodobné, že to takto zůstane i do budoucna. Konkurenční boj mezi velkými hráči vzrostl, to by mělo přispět k vývoji inovativních řešení.

Úvodní slovo Jiřího Kadlečka

Úvodní slovo Jiřího Kadlečka

Chris Sherman při výkladu

Chris Sherman při výkladu

Chris Sherman při výkladu

Chris Sherman při výkladu

Chris Sherman při výkladu

Účastníci workshopu

Účastníci workshopu

(lj)

Hodnocení: 
Zatím žádné hodnocení
IKAROS, redakce. Novinky ve světě vyhledávání na webu v roce 2010 (Chris Sherman). Ikaros [online]. 2010, ročník 14, číslo 5/2 [cit. 2022-05-17]. urn:nbn:cz:ik-13423. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/13423

automaticky generované reklamy