Cuil aneb Vyhledávání jinak?
V polovině letošního roku se objevil nový vyhledavač – Cuil [čti ku:l] (http://www.cuil.com/ [4]). Další vyhledavač – může někdo nabídnout ještě něco nového?
První dojem
Po zadání dané adresy se objeví stránka, která vypadá jako pravý opak Googlu – je černá s šedomodrým nápisem Cuil (viz obr. 1). Přímo vyzývá k porovnání se známým Googlem. Navíc se v informacích o sobě přímo honosí tím, že prohledává 3x více webových stránek než právě Google a dokonce 10x více než MSN [1]. Na úvodní obrazovce to dokládá číslo 121 617 892 992 indexovaných webových stránek. Google toto číslo tají, takže tuto informaci nemáme jak ověřit.
Úvodní obrazovka
Začnu tedy základní věcí: zkusím něco vyhledat. Po zadání hesla „Ústav informačních studií a knihovnictví“ do Googlu i Cuilu přichází překvapení – výsledné zobrazení výsledků vypadá úplně jinak. V Cuilu není seřazeno postupně od shora dolů, ale ve sloupcích. Navíc jsou jednotlivé výsledky doplněny obrázky z dané webové stránky, aby se uživatel mohl lépe zorientovat (viz obr. 2).
Zobrazení výsledků
Druhý dojem
Ještě zajímavější výsledek se však naskytl po vyhledání termínu „Čapek Karel“. Vedle výsledků se zobrazily obrázky Karla Čapka, ale hlavně se v pravé části obrazovky objevilo zařazení této osobnosti do tematických skupin (viz obr. 3): např. mezi české dramatiky. Navíc po přejetí myší nad touto skupinou se objeví další termíny (zde samozřejmě osobnosti, i když pouze čtyři), které do této tematické skupiny patří také (např. Pavel Kohout). Za povšimnutí ale stojí i to, že vyhledané výsledky byly téměř bez výjimky zahraniční webové stránky (uživatel by u Čapka čekal české, když to byl Čech a předpokládáme, že Češi o něm píší nejvíc). S tím souvisí i to, že na rozdíl od Googlu Cuil neumožňuje přednostně prohledávat české webové stránky. Je však nutné uznat, že Cuil je mladý a to vše může ještě přijít.
Zařazení hledaného výrazu do tematické skupiny
Jiné je i množství vyhledaných záznamů: Cuil jich pro „Ústav informačních studií a knihovnictví“ našel 1 307, Google 31 700. Stejně jako jsou rozdílná tato čísla, jsou rozdílné i časy, jaké tyto vyhledavače potřebovali: Google 0,41 sekundy (Google si čas sám měří), Cuil asi 3 sekundy (měřeno mými stopkami). Podle článků na internetu je to přímo propastný rozdíl, mně tento 2 a půl sekundový rozdíl nevadil.
Zajímavé je i roztřídění záznamů u homonym či jmen. Po zadání termínu „Ehrlich“ se jednotlivé záznamy roztřídí do záložek „Paul Ehrlich“ (slavný lékař), „Gretel Ehrlich“ (americká spisovatelka) a „Robert Ehrlich“ (americký obchodník) a další, kde je celý seznam Ehrlichů (viz obr. 4). U Čapka by se nabízelo roztřídění na Karla Čapka a Josefa Čapka, ale tam bohužel roztřídění nefungovalo.
Roztřídění výsledků
Cuil stejně jako Google používá našeptávač, Google má ale nově zlepšení: nejen že našeptá, ale vedle jednotlivých nabídnutých výrazů zobrazí i počet stránek, kde se výraz vyskytuje. To je jistě zajímavé, ale v té rychlosti, kdy něco hledáte, si toho stejně nestihnete všimnout (viz obr. 5).
Našeptávač v Googlu a v Cuilu
Naopak za velký nedostatek můžeme považovat absenci nápovědy. Jak např. vyhledat stránky, které obsahují nějaký termín, ale neobsahují jiný, se můžeme jen domýšlet. Rozhodně to není pomocí „NOT“ ani mínusu. Cuil ani nenabízí rozšířené vyhledávání, kde bychom si mohli z booleovských operátorů vybrat nebo kde bychom mohli vyhledávat jen v obrázcích, podle čísel nebo podle formátu. Možná to prostě nejde a pak ani nápovědu nepotřebujeme.
O Cuilu jako firmě
Zakladateli Cuilu jsou Tom Costello, Anna Pattersonová a Russell Power. Zajímavostí jistě je, že Pattersonová a Power pracovali v Googlu. Oba se starali o TeraGoogle – index Google, Pattersonová byla dokonce jeho tvůrkyní. Všichni tři mají doktorát z počítačové vědy [2]. Ve filozofii Cuilu se však dozvídáme, že přebírání cizích postupů není jejich cílem, proto tým Cuilu vytvořil zcela nový způsob práce, tedy jiný algoritmus vyhledávání a jiné řazení výsledků [3]. Není tajemstvím, že Google výsledky vyhledávání řadí např. podle toho, jak jsou odkazované z jiných stránek (technologie PageRank) [4]. Cuil (aniž by Google jmenoval) tuto techniku kritizuje a dává příklad, kdy by telekomunikační firma přestala registrovat v telefonním seznamu málo používaná telefonní čísla jenom proto, že je na ně málo voláno. Přesto se totiž najdou tací, kteří by toto telefonní číslo potřebovali zjistit [3].
Cuil se zcela zjevně snaží působit jako malá (honosí se tím, že má pouze 30 zaměstnanců) a otevřená firma, která nic netají a ráda pomůže. Dokládá to jak množství informací, které o sobě na svých webových stránkách v sekci About us poskytuje, tak např. možností kontaktovat e-mailem Jima, když se vaše stránky ve výsledcích nezobrazí [5]. Díky němu prý již někteří uživatelé - provozovatelé webových stránek Cuilu poděkovali, že byli poprvé zahrnuti do indexu.
Posledním vstřícným krokem je možnost zapnout či vypnout „dětskou pojistku“ – tedy funkci, která (samozřejmě bez záruky) zabraňuje zobrazení webových stránek s pornografickým obsahem (viz obr. 6).
Dětská pojistka
Ve své otevřenosti však firma zapomněla uveřejnit, kdy Cuil spustila (nebo tuto informaci umně ukryla), v sekci o ochraně dat se však dozvídáme, že text vstoupil v platnost 27. července 2008, z čehož se lze alespoň domnívat, že to bylo během letních prázdnin. Proto je dobré si uvědomit, že všechny nedostatky, kterých z mého pohledu není mnoho, mohou být brzy odstraněny a že porod „největšího světového vyhledavače“ není otázkou dnů.
- Cuil. About us [online]. [cit. 2008-09-17]. Dostupné z WWW: <http://www.cuil.com/info [11]>.
- Cuil. Management. About Cuil [online]. [cit. 2008-09-17]. Dostupné z WWW: <http://www.cuil.com/info/management [12]>.
- Cuil. Our philosophy. About Cuil [online]. [cit. 2008-09-17]. Dostupné z WWW: <http://www.cuil.com/info/our_philosophy [13]>.
- Google. Informace o korporaci : přehled technologie. Vše o Google [online]. c2008 [cit. 2008-09-17]. Dostupné z WWW: <http://www.google.cz/corporate/tech.html [14]>.
- Cuil. Webmaster info [online]. [cit. 2008-09-17]. Dostupné z WWW: <http://www.cuil.com/info/webmaster_info [15]>.
- MANBER, Udi. Úvod do kvality vyhledávání Google. Google Blog Česká republika [online]. 2008-06-09 [cit. 2008-09-17]. Dostupné z WWW: <http://google-cz.blogspot.com/search/label/vyhled%C3%A1v%C3%A1n%C3%AD [16]>.
- SINGHAL, Amit. Úvod do hodnocení a řazení výsledků na Googlu. Google Blog Česká republika [online]. 2008-06-09 [cit. 2008-08-18]. Dostupné z WWW: <http://google-cz.blogspot.com/search/label/vyhled%C3%A1v%C3%A1n%C3%AD [16]>.