Robotické knižní skenery - Číslo 5 už (skoro) žije?
Uplynulo už 18 let od doby, kdy se na plátnech kin poprvé objevil úžasný robot, který jen tak mimochodem předvedl něco úžasného, něco, co je už desítky let předmětem zájmu stále početnějšího zástupu amatérů i profesionálů: během několika okamžiků dokázal automaticky naskenovat a převést do textové podoby vázanou knihu, aniž ji přitom poškodil. Že té knize i porozuměl a pak ji jako nepotřebnou odhodil, to je už vedlejší. :-)
Ačkoli počátky systematického úsilí o převod tištěného textu do elektronické podoby a jeho volné zpřístupnění můžeme klást už do roku 1971, kdy vznikl první text v rámci projektu Gutenberg, trvalo dalších 23 let, než bylo dosaženo první stovky titulů. Za další tři roky se počet vyšvihl na první tisícovku a v loňském roce už padla meta 10000 elektronických knih. Úspěch tohoto projektu tkví především v ochotě armády dobrovolníků: ti knihy nejprve přepisovali ručně, zvýšení efektivity práce pak s sebou přinesly první skenery. S denním přírůstkem přibližně deseti nových titulů je v současné době projekt Guttenberg jedním z nejvýznamějších projektů, zabývajících se převodem tištěného slova do digitální podoby.
Přes všechny úspěchy však tento projekt naráží na jisté limity: protože převážná většina přispěvatelů pracuje s deskovými skenery, stráví nejvíce času obracením stránek a díky relativně pomalé rychlosti snímání lze takto pořídit přibližně 240 stran za hodinu. Zvýšit efektivitu práce je v takovém případě možné například použitím automatického podavače papíru. Ten sice práci urychlí a především ji uživateli značně usnadňuje, přináší s sebou ale jednu drobnou nevýhodu: z knihy se musí vyřezat všechny listy, které se navíc podavači mohou zmačkat nebo potrhat.
Je zřejmé, že tato řešení, fungující ve společenstvích dobrovolníků a nadšenců, nemohou oslovit knihovny a další instituce, zabývající se ochranným reformátováním dokumentů. Ani nasazení planetárních skenerů neřeší problém drahé lidské síly, která musí takové zařízení obsluhovat a otáčet stránky, protože efektivita této práce není obvykle výrazně vyšší než u výše zmíněných postupů, je jen o něco radostnější.
Jak ale naznačil úvod, blýská se na lepší časy. Již dvě firmy přišly nezávisle na sobě s produktem, kombinujícím planetátní skener a robotické otáčení stránek. První z nich, švýcarská 4DigitalBooks [4], přišla se svým zařízením na trh již koncem roku 2002, kdy instalovala svoji první digitalizační linku na Stanfordově univerzitě [5]. Tato digitalizační linka [6] je vybavena planetárním skenerem firmy I2S DigiBook [7] a její kapacita je až 1500 stran za hodinu. Umožňuje zpracovávat knihy od velikosti A5 do velikosti A2, přičemž celý proces digitalizace začíná i končí zavřenou knihou. Kniha je v zařízení držena podtlakem a stejným způsobem je zajištěno otáčení stránek. Videosnímek zachycující tuto digitalizační linku v akci je k vidění na stránkách http://www.infotechnique.com/main_en.htm [8] (komentář ve francouzštině).
Americkou odpovědí na evropskou výzvu byl o rok později produkt APT BookScan 1200 [9] firmy Kirtas Technologies [10]. Tento digitalizační robot je ve srovnání se svým evropským protějškem podstatně menší, levnější, má menší spotřebu a je i o něco rychlejší. Velikost snímaných knih je shora omezena formátem o něco přesahujícím A4, což je také nejvýznamější nevýhoda tohoto zařízení oproti konkurenci. Díky omezení velikosti předlohy však mohl být pro skenování použit běžný digitální fotoaparát s rozlišením 10 megapixelů, který snímá zvlášť pravou a levou stranu pootevřené knihy prostřednictvím otočného zrcadla. Také mechanismus otáčení stránek je v tomto zařízení na první pohled šetrnější, než u konkurence, další výhodou pak je, že jeden operátor může obsluhovat až čtyři stroje zároveň. Videosnímek [11] je v vidění na stránkách výrobce.
Firma Kirtas udává, že celková cena za digitalizaci jedné stránky rozpočítaná na dobu životnosti stroje 10 milionů snímků je přibližně 3 centy, pokud operátor obsluhuje jen jeden stroj, přičemž tohoto počtu snímků se dá při dvousměnném provozu dosáhnout již za necelé 3 roky. Pokud si těchto 10 milionů snímků představíme jako 50 000 dvousetstránkových knížek, které si dále můžeme představit jako 10 GB textu (kapacita 1 nebo 2 DVD), nebo jako 4,5 TB obrázků (ani vystavení takového objemu dat na Internetu nepředstavuje dnes závažný technický nebo finanční problém). Nasazením této technologie by se tak dalo za poměrně krátkou dobu a s vynaložením relativně malého množství prostředků dosáhnout digitalizace a volného zpřístupnění například všech autorsky nechráněných bohemikálních knižních publikací, včetně například starých tisků (pokud bychom si je ovšem troufli svěřit na chvíli do přísavek strojům).