Zamyšlení nad výzkumy
Nedávno vyšel v Ikarovi článek, který pojednával o výsledcích výzkumu mapujícího chování uživatelů na internetu – tedy kolik času tráví u počítačů, jak často využívají určitou službu, jak nakládají se svými osobními údaji a podobně. Výzkum byl zaměřený zejména na děti a na případná rizika, která jim mohou na internetu hrozit. Výzkum to byl podle mého názoru zajímavý a přinesl pozoruhodné (avšak ne zrovna povzbudivé) výsledky. Nicméně v následné diskuzi se ozývaly četné hlasy (tedy minimálně jeden četný hlas), že je ten výzkum neprůkazný, že jsou jeho výsledky zkreslené a že žádný takový problém možná ani neexistuje (tedy že to je spíše jen mediální bublina).
Diskuze byla dlouhá jako úvodní titulky Hvězdných válek a týkala se několika různých témat. Co se týče bezpečnosti dětí na internetu, osobně se domnívám, že to problém opravdu je a že si zaslouží naší plnou pozornost. Ostatně zrovna teď v únoru proběhlo několik zajímavých akcí a případným zájemcům bych rád doporučil aktuální článek, který se tomuto tématu věnuje. Další otázkou byla média obecně a jejich časté zveličování či zkreslování problémů. To je zajímavý námět na dlouhé zimní večery a určitě by vydal na samostatný článek. Ale v tomto textu bych se rád zaměřil pouze na otázku výzkumů; tedy jestli jsou spolehlivé a jestli mají vůbec nějakou vypovídací hodnotu.
S výzkumy se člověk může setkat téměř všude, v televizi, v tisku, na internetu… Dokonce se zdá, že anket, průzkumů a výzkumů je čím dál více. Jako by bylo žádoucí jimi podpořit každou zprávu. V reportáži ze sjezdu politické strany někdo zmíní předčasné volby a hned se objeví tabulka předpokládaných volebních výsledků. Další zprávou je třeba jednání o možné radarové základně USA a rázem se objeví ‚koláč‘, který ilustruje kolik lidí je pro, kolik proti a kolik neví nebo nechápe otázku. A když ve zprávě o probíhající technoparty není k dispozici bleskový výzkum agentury Stem, tak se použije alespoň orientační anketa mezi náhodnými občany (samozřejmě s maximální snahou o „objektivitu“, takže se tam objeví stará shrbená babička, spěchající podnikatel, fešná policistka i dredy pokrytý technař).
Zvláštní, není-liž pravda? Jako by takové průzkumy byly téměř nedělitelnou součástí většiny zpráv, jako by nějaká reportáž nebyla bez ankety úplná. Zkrátka jako by i ten nejmenší výzkum dodával informaci ve zprávách či v článku určitý punc pravdivosti nebo spolehlivosti. Ovšem ve skutečnosti tomu tak není. Většina takzvaných ‚bleskových‘ výzkumů má vypovídací hodnotu blížící se nule. Většinou jde jen o to, zeptat se několika lidí v okolí a pak vytvořit dramatický sestřih názorů nebo nějaký graf, aby divák viděl, na čem se domnělé informace a závěry zakládají. Nedělejme si tedy příliš iluze, že by tyto rychlé ankety o něčem opravdu vypovídaly.
Ovšem druhá věc jsou výzkumy podrobnější a sofistikovanější. Během delšího časového intervalu se sbírají data, zkoumají se a vyhodnocují a nakonec se zhmotní v nějaký výsledek. U rozsáhlých výzkumů lze zkoumat složení vzorku respondentů a zjišťovat, zdali vzorek může reprezentovat určitou cílovou skupinu či dokonce celou populaci. Je kladen větší důraz na samotné provedení (tedy třeba cílené rozhovory namísto anonymního dotazníku) a berou se v úvahu i možné odchylky. Výsledky takových výzkumů pak lze brát jako důvěryhodné – nebo alespoň „důvěryhodnější“.
Je jasné, že anketní otázka položená pěti lidem na náměstí nepřinese tak reprezentativní výsledky jako několikaměsíční sociologický výzkum. Nicméně celá problematika má ještě jeden aspekt, kterým je prezentování získaných výsledků. Mají se i samotné výsledky snažit o maximální úplnost a přesnost? To mne přivádí zpátky k textu, o kterém jsem hovořil na začátku. Článek se zabýval bezpečností dětí na internetu, byly v něm uvedeny výsledky online výzkumu agentury Gemius, který měl formu dotazníku (na různých českých portálech). Výsledky pak vypadaly například takto: „cca 90 % respondentů pracuje na internetu s e-mailem“, „60 % dětí již někomu na internetu poslalo své telefonní číslo“ nebo „pouze 40 % dětí uvedlo, že s nimi rodiče mluvili o možných hrozbách“. Tedy byly to informace, které jsou prakticky ve všech podobných článcích prezentujících výsledky nějakého výzkumu.
Nicméně v diskuzi pod článkem se kolega Roman Chýla vyjádřil v tom smyslu, že takto prezentované výstupy nejsou víceméně k ničemu. Cituji: „Média se vždy raději chytí formulace „25 % dětí kouří marihuanu“ na místo toho, aby musela uvádět „průzkum byl/nebyl reprezentativní, zachytil skupinu xy, z nichž vyplývá, že skutečné procento populace X, které kouří marihuanu, se na rovině pravděpodobnosti 95% pohybuje v rozmezí 13-37%“. Taková informace je jaksi málo kořeněná (vždyť oni to vlastně neví!), ale pro rozhodování a akce je lépe opírat se o nezabarvené podklady.“
S tou myšlenkou se dá do jisté míry souhlasit: za prvé, média se skutečně ráda chytají silně zjednodušených informací a mnohdy má ‚úderný titulek‘ vyšší prioritu než samotný obsah zprávy. Druhá věc je, že zejména anonymní online průzkumy nemohou být generalizovány a vztaženy na celou populaci. S tím vším samozřejmě souhlasím, protože zmiňovaný výzkum byl spíše orientační a jeho hlavní přínos spočíval zejména v tom, že to byl prakticky první výzkum, který u nás na toto téma proběhl. A v tomto případě je podle mého názoru opravdu lepší mít výsledky ze skupiny cca 1500 online respondentů (12–17 let), než nemít výsledky žádné. Nechci teď ale obhajovat onen výzkum (o to jsem se pokusil již ve zmiňované diskuzi), rád bych se však zaměřil jen na samotnou prezentaci výsledků.
Zatímco bleskové ankety mezi několika málo lidmi jsou příkladem, jak by výzkum vypadat neměl, obávám se, že toto je zase opačný extrém. Ani si nemůžu vybavit, že bych kdy vůbec v nějakém článku četl, že ten či onen výsledek výzkumu leží na nějak definované rovině pravděpodobnosti, v určitém intervalu a v rámci konkrétní skupiny respondentů. Krátká zpráva o tom, že Internet Explorer dosáhl 85% podílu mezi prohlížeči, Firefox má 11 %, Opera 2 % a o zbytek se dělí minoritní browsery (procenta jsem si prosím vymyslel), by se tak totiž záhy roztáhla na půlstránkový článek, kde by se převalovaly různé roviny pravděpodobnosti a ze samých intervalů by čtenář dohromady nic moc nezjistil.
Dlouho jsem uvažoval, jaký příklad zvolím pro ilustraci. Možností bylo mnoho, protože výsledky v klasické formě „název: procenta“ se vyskytují prakticky všude. Nakonec jsem se rozhodl pro jeden článek Petra Saka na Lupě. S docentem Sakem se v některých věcech neshodneme (kupříkladu v otázce zhoubného vlivu technologií na četbu), ale jednu věc mu upřít nemohu: je to člověk, který se intenzívně věnuje sociologickým výzkumům a co se týče tvorby statistik a prezentování dat, mělo by být vše v pořádku. Hned na začátku svého článku (prvního dílu série) popisuje pozadí výzkumu (jedná se o studii v rámci grantu Ministerstva práce a sociálních věcí) a následuje popis metodologie (velikost a složení vzorku respondentů, standardizovaný rozhovor). A pak už se objevuje množství tabulek a grafů.
A zde je háček: i když je použitá metodika bezesporu mnohem sofistikovanější než u prvního příkladu, přesto není podle mého názoru možné hovořit o tom, že vzorek 1800 lidí dokáže zcela reprezentovat celou naší společnost. Ale i tak lze každou chvíli narazit na větu typu „česká populace je vybavena technologií X z tolika a tolika procent“. Tedy i pan docent Sak by asi měl ve svých textech raději upozornit na to, že výsledky nelze automaticky generalizovat a že se nedají stoprocentně vztáhnout na celou populaci. Možná by měl pro jistotu přidat i nějaký ten interval a rovinu pravděpodobnosti.
Nicméně tohle vše není namířené ani proti výzkumům pana Saka, ani proti námitkám v diskuzi; situace je zkrátka taková, že určitá nespolehlivost se váže v podstatě na všechny výzkumy. Nikdy není výzkum zcela reprezentativní, vždy existují odchylky. Komplexní studie z grantu MPSV ČR je sice přesnější než online ad hoc výzkum agentury Gemius v rámci projektu Safer Internet, ale přesto není neomylná. A pokud Roman Chýla prohlásil v souvislosti s prvním článkem „oni to vlastně neví!“, tak na adresu druhého výzkumu (o komputerizaci) by se slušelo říci „oni toho ví možná trochu víc, ale taky nic moc“.
Anonymní online výzkumy trpí tím, že se jich účastní jen ten, kdo chce, a bez nejmenších problémů je možné uvádět i záměrně chybné informace. Složitější metody využívající i rozhovor jsou v tomto ohledu přesnější, ale i tak nemusí respondent odpovědět vždy pravdu; jeho odpovědi mohou být ovlivněny kupříkladu náladou, stresem, zdravotním stavem a podobně. A i při vzorku několika stovek či tisíc lidí mohou být takové odchylky stále docela významné. Situace kolem výzkumů tedy není zrovna jednoduchá.
Co se dá dělat; většina výzkumů ani nemá takto propracovanou metodiku a ani okruh dotazovaných nebývá větší. Drtivá většina výsledků z těchto průzkumů tedy nemůže reflektovat stav v celé společnosti. Nicméně já se domnívám, že diváci / čtenáři / posluchači to vědí a není třeba je tak zatěžovat neustálými intervaly, odchylkami, pravděpodobnostmi a podobně. Skutečnost je zkrátka taková, že žádný výzkum nemůže být zcela reprezentativní a vždy jsou výsledky do jisté míry zkreslené (spolehlivé hlasování všech obyvatel si může dovolit nějaký menší kmen, ale nikoliv desetimilionový stát nebo ještě mnohem větší země).
Nezáleží na tom, jestli svoji adresu poslalo přes internet 20 % dětí, nebo 30 %. Jde ale o to, že se takto některé děti chovají a mělo by se s tím něco dělat. Stejně tak je jedno, jestli má Internet Explorer 85% podíl, nebo jestli má o čtyři procenta více nebo méně. Primární je zde opět jen informace, který prohlížeč je nejrozšířenější. Osobně se tedy domnívám, že v rámci běžného zpravodajství (televize, tisk, internet) je klasický vzorec typu „Ikaros čte pravidelně až 75 % uživatelů internetu“ naprosto dostatečný. A podrobnější verzi s jasně definovanou skladbou respondentů a množstvím dalších informací si může zkoumat třeba Český statistický úřad nebo Nejvyšší Redakční Rada Ikara.
Co z toho všeho plyne? Asi to, že by se význam anket a průzkumů neměl příliš přeceňovat. Takové výzkumy a studie jsou zkrátka jen orientačním a doplňujícím informačním zdrojem – a čtenáři to myslím vědí. Nechci tím v žádném případě říci, že máme svým způsobem rezignovat a spokojit se s nepodloženými a nepřesnými výsledky; ale na druhou stranu nemůžeme zabřednout do nekonečného konkretizování detailů. Stejně to nemá valný smysl, protože žádný výzkum nemůže být zcela přesný. A krom toho: nezapomínejme, že úkolem médií je své čtenáře informovat, nikoliv je informacemi zahltit.