Pět exabytů nových informací za jediný rok
Kalifornská univerzita v Berkley (přesněji Škola informačního managementu a systémů jako její součást) nedávno zveřejnila studii pojednávající o množství informací, které ve světě vzniklo v roce 2002 [4]. Předcházející studie z roku 2000 [5] byla podložena daty z roku 1999.
Na výzkumu se podíleli zejména Peter Lyman a Hal R. Varian, koordinátorem byla Kirsten Swearingen. Byla rozvinuta i spolupráce s univerzitními studenty. Výsledky výzkumu v obou studiích jsou stále otevřené. Mohou se totiž objevit nové informační zdroje, které upřesní stávající odhady. Například pro rok 1999 bylo množství nových unikátních informací odhadnuto na jeden až dva exabyty. Na základě využití nových zdrojů byl tento odhad v nynější studii revidován na dva až tři exabyty.
Výzkumní pracovníci jsou si plně vědomi mezí použitých metod. Při interpretaci výsledků je třeba vzít v úvahu jednak nutné nepřesnosti vznikající při odhadování množství informací, jednak související otázky duplikátů (respektive multiplikátů) informací a v nezanedbatelné míře také problematiku komprese digitálních materiálů.
Nově vzniklé informace lze uchovávat v tištěné, filmové, magnetické a optické podobě. Neexistuje však společný standard, s nímž by se dalo poměřovat množství informací zachycených na různých médiích. V tomto výzkumu byla jako standard použita jednotka terabyte. Na tuto jednotku byly přepočítávány informace zachycené na analogových médiích.
Za poslední tři roky se množství nových informací přibližně zdvojnásobilo - v roce 2002 vzniklo celkem zhruba pět exabytů nových informací (předpona exa- není zatím běžně používána, proto doplním, že znamená deset na osmnáctou). Z toho bylo 92 % uloženo na magnetických médiích, zejména na pevných discích. Není divu – kdyby celých pět exabytů bylo uchováváno v tištěné podobě, pak by bylo potřeba zhruba půl milionu nových knihoven o velikosti Kongresové knihovny! V tištěné podobě bylo uloženo pouhých 0,01 % nových informací.
Celých 40 % nových informací uchovávaných na jakémkoli z uvedených médií vytvářejí Spojené státy. V celosvětovém měřítku připadá na jednu osobu zhruba 800 MB nových informací ročně (tento odhad vychází z údaje, že světová populace je tvořena zhruba 6,3 miliardy jedinci).
Množství informací tištěných na papíře poněkud boří vizi bezpapírové společnosti - neustále totiž roste. Převážnou část originálních informací tištěných na papíře tvoří administrativní dokumenty a tradiční pošta. Papír je navíc stále hlavním prostředkem publikace oficiálních informací.
Specifické postavení v oblasti distribuce tištěných dokumentů zaujímají Spojené státy. Právě tam se na druhé místo totiž po administrativních dokumentech dostávají knihy, a nikoli periodika určená pro širokou veřejnost, jak je tomu jinde ve světě. Je to způsobeno mj. objemem amerického nakladatelského průmyslu a úrovní vzdělanosti obyvatel. Využití papíru v kancelářích zase roste díky neustálému zlepšování možností počítačových tiskáren, kopírek i multifunkčních zařízení (zvyšování rychlosti, snižování nákladů na tisk). Na nárůstu se podílí i tisk dokumentů získaných prostřednictvím internetu.
Zatímco ve státech s rozšířeným přístupem k internetu prodejnost novin spíše stagnuje až klesá, v rozvojových zemích je tendence přesně opačná. Z evropských zemí tvoří výjimku Irsko s výrazným nárůstem prodeje novin.
Informace dostávající se k nám prostřednictvím elektronických kanálů (telefonu, rádia, TV a internetu) představovaly v roce 2002 na 18 exabytů nových informací. 98 % z tohoto množství představují telefonní hovory (zahrnuta jsou hlasová i datová volání, a to pomocí pevných linek i bezdrátově).
Většina radiového a televizního vysílání neobsahuje nové informace. Zhruba 70 miliónů hodin radiového vysílání z celkových 320 milionů je možno považovat za originální, v případě televizního vysílání to je přibližně 31 miliónů z celkových 123 miliónů.
Na webu je k dispozici zhruba 170 terabytů informací. Tzv. hluboký web v tomto čísle není zahrnut, představuje dalších zhruba 92 000 terabytů. Fenomén instant messaging se zasluhuje o vznik přibližně 274 terabytů informací ročně. V případě e-mailové komunikace se jedná o 400 000 terabytů ročně. Denně je posláno na 31 miliard e-mailů (předpokládá se, že do roku 2006 se tento počet zdvojnásobí). Podstatný nárůst zaznamenávají i sítě P2P. Většina jejich uživatelů však soubory pouze stahuje a neposkytuje vlastní soubory ke sdílení.
Výrazný nárůst je typický i pro digitální fotografování, fotografování s využitím filmu naopak klesá. Kinematografie a televize se kvůli nižším nákladům začínají přesouvat k digitálnímu videu. V medicíně se digitální technologie také rychle rozvíjejí, vzhledem k nákladům stále převažuje rentgen využívající film.
Celou studii je možné si stáhnout z adresy uvedené na začátku článku. Jedná se o zhruba sto stran tabulek a doprovodného textu. K dispozici je rovněž zkrácený výtah obsahující všechna podstatná zjištění výzkumu.
Dodejme ještě, že výzkum finančně podpořily Microsoft Research, Intel, Hewlett Packard a EMC. Komentáře k výsledkům výzkumu, nové podněty či náměty na využití nových spolehlivých zdrojů dat je možné zasílat na adresu how-much-info@sims.berkeley.edu [6].