Jak může digitalizace škodit bádání

English title: 
How Digitization Can Harm Research
Abstract: 

A speech given by the author Caleb Crain while participating in a panel about libraries informs about his stand on recent development at the New York Public Library. Also raises questions about the advantages of digitization, considering the usual approach of libraries. Organizational and technical aspects are mentioned, as well as copyright issues preventing a wide circulation of books among public. The author provides his view on a work with conventional and electronic books as well as a number of systematic flaws and notable problems that information science is facing in the digital age.

Autor: Caleb Crain | pracovní překlad: Pavel Farkas

V pátek 26. října 2012 jsem se účastnil panelové debaty o knihovnách na In Re Books, konferenci o právu a budoucnosti knih, kterou pořádala Právnická škola města New York (New York Law School). Hovořil jsem o tom, jak digitalizace knih škodí studiu. Zmíněná škola bude zřejmě publikovat odkaz na videozáznam, ale níže předkládám verzi mé řeči.

Dobré odpoledne. Dnes tu jsem za Luddity. Promluvím na téma škodlivosti digitalizace textů; věřím, že studium literatury je tradičním posláním knihoven, avšak digitalizace ho může zpomalit nebo mu uškodit. Tak by tomu nebylo, kdyby byly digitální texty pouhým doplňkem textů tištěných. Jenomže ve skutečném světě, kde jsou rozpočty a zdroje omezené, přinášejí digitální texty změnu. Myšlenkou na Luddity jsem se začal pomstychtivě zabývat letos na jaře, kdy jsem protestoval proti plánům Veřejné knihovny města New York (The New York Public Library – NYPL) konsolidovat svou pobočku na Manhattanu tím, že většinu knih ze svého fondu naučné literatury přemístí do New Jersey. Bylo mi jasné, že skladování titulů mimo pobočku bylo nutné zlo, ale stejně se jednalo o zlo. V případě potřeby se měly knihy z New Jersey do New Yorku dostat během dvou dnů, ale ve skutečnosti to byly spíše dny tři nebo čtyři, někdy dokonce déle.

Přestože digitalizace umožňuje pohodlný dálkový přístup ke zdrojům, studovna newyorské knihovny zůstává hojně obsazena čtenáři, kteří se za knihou neváhají vydat osobně

Přestože digitalizace umožňuje pohodlný dálkový přístup ke zdrojům, studovna newyorské knihovny zůstává hojně obsazena čtenáři, kteří se za knihou neváhají vydat osobně (Foto: P.Farkas)

Správci navíc zvažovali návrh, který šel do extrémů. Z pěti milionů knih ve lvy zdobené knihovně společenských věd na 42. ulici jich mělo zůstat jen 1,8 milionu. Tyto plány knihovna spředla v roce 2008, kdy svět oněměl úžasem nad výhledy projektu Google Books, ale v roce 2011 přišlo zamítnutí soudce Dennyho China: ze stolu smetl navržené vyrovnání mezi Google Books a organizací Authors Guild zastupující autory. To znamenalo, že v dohledné budoucnosti udržela autorská práva většinu knih mimo digitální distribuci.

Opice skáče džunglí a vidí nejbližší větev, které se chytí, ale jen málokdy už vidí tu další. Učenec vlastně postupuje stejně: v poznámkách pod čarou jedné knihy nalézá jména knih dalších, které si zapisuje do svého seznamu literatury k přečtení. Zmíněné plány NYPL hrozily takové studenty zpomalit na rychlost jedné větve každé dva nebo tři dny. To je ale velmi pomalá opice.

Učenci založili petici, novináři psali články do The Nation, New York Times nebo žurnálu n+1; já sám blogoval jako o život, až si ze mě čtrnáctidenník The New Republic dělal legraci; byl jsem pozván do poradního výboru knihovny; byl jsem vyhozen z poradního výboru knihovny; administrátoři knihovny probírali kritiku v panelu New School; v čtrnáctidenníku The New York Review of Books byly otištěny náruživé dopisy editorovi. A před měsícem administrátoři knihovny oznámili, že dar správkyně Abby Milsteinové a jejího manžela Howarda Milsteina ve výši 8 milionů dolarů umožní knihovně uchovat dalších 1,5 milionu knih pod veřejným prostranstvím Bryant Park mezi pátou a šestou Avenue. Tento kompromis výrazně zmírňuje dopady plánované konsolidace, a přestože mám stále nějaké výhrady, jsem jednak vděčný za dar od Milsteinových a jednak za ochotu knihovny reagovat na obavy rozhořčených učenců. (V posledním půlroce knihovna radikálně zlepšila doručování titulů z externího skladu, nyní jsou knihy  připraveny během 24 hodin.)

Dnes bych chtěl pohovořit trochu obecněji o nebezpečích, kterým čelí bádání v digitálním věku. Dokonce i takový Luddita jako já si uvědomuje, že digitální kopie jsou skvělými doplňky. Kolikrát mi pomohly najít citaci, kterou jsem si pamatoval, ale kterou jsem už nedokázal dohledat. Pro historika je možnost prohledávat miliony starých novin nedocenitelná. Nicméně musím poznamenat, že e-kniha je sama o sobě vzhledem k požadavkům na výzkum médiem rozporuplným. Například její trvanlivost je nezaručena. Tištěné knihy mohou shořet, nebo vlákna papíru mohou zkřehnout – to jsou problémy, které knihovní systém vyřešil skladováním více kopií titulu na více místech. Jakým nebezpečím čelí elektronické texty? Přežijí například nečekané výpadky energie během válečných konfliktů? Co třeba neustálé změny ve formátu souborů? Stále mám digitální soubory s eseji, které jsem napsal před 25 lety na střední škole, ale mnoho z nich nemohu přečíst, protože pro otevření v současných textových editorech neexistují potřebné konvertory. Možná, že elektromagnetická úložiště vydrží staletí, možná, že se formáty souborů od teď už nebudou měnit... ale zatím si ještě nejsme jistí. [Během závěrečné diskuze mi kolega v panelu prozradil, že soubory uložené v The Internet Archivu se musí přehrávat přibližně každé čtyři roky. Jejich hard disky se neustále střídají; digitální ochrana vyžaduje nepřetržité úsilí.]

Dále tu máme autorská práva, která dnes určují (a efektivně blokují) pravidla pro digitální cirkulaci 26 miliónů titulů z těch 32 miliónů v historii vydaných – dokud Kongres a jiné legislativní organizace neintervenují. Jen několik hlavních amerických nakladatelů prodává e-knihy knihovnám, a jeden z nich prodává pouze licence, které expirují po 26 výpůjčkách. Knihovna plná samorušících knih je vskutku badatelovou noční můrou.

Digitalizace není první „horečkou“, která mezi knihovníky propukla a mnoho výtek, které před více než dekádou Nicholson Baker vznesl na úkor mikrofilmu, se dají uplatnit i na digitální zástupce. Díky digitalizaci můžeme během několika skenů z knihy udělat matrici (master copy). Ale co když tyto matrice obsahují chyby? Co když někdo později, kdy se původní knihy staly vzácnými tisky nebo jsou prakticky nedostupné, chce takovou knihu vidět ve větším rozlišení? Co když někdo chce tuto knihu vidět v barvě? Co když lidé, kteří knihy skenují, vyberou výtisk, který neobsahuje všechny verze, díly nebo vydání toho kterého díla? Když jsem před nedávnem zpracovával téma Britsko-americké války, chtěl jsem si půjčit knihu Fragments od Voyages and Travels od Basila Halla, memoáry britského námořníka, které byly tak populární, že byly vydány v mnoha edicích. NYPL poslala všechny své edice do externího skladu, ale jejich on-line katalog v případě devítisvazkové edice vytištěné v Edinburku odkazuje na digitální knihovnu Hathi Trust. Jenomže ta nabízí jenom jednu z devíti částí. Trust má sice také skeny udělané v jiných knihovnách, ale jeden z takových souborů je porušen, další má na všech stránkách odříznuté poslední dva řádky, ostatní jsou pak zkrácená americká vydání. V knihovně Hathi Trust jsem našel jen tři čitelné skeny z devíti edinburských svazků, jen tři další na Google Books. (Býval bych včera večer zkusil Internet Archive, ale server byl mimo provoz.) Fyzický exemplář čtvrtého svazku ze sbírek NYPL se mezitím ztratil. Když jsem se po něm jal pátrat, knihovník mě v poznámce odkázal na Hathi Trust.

E-knihy, pokud jsou k dispozici, jsou dostupnější než knihy tištěné, ale hůře se čtou. Historička raného novověku mi nedávno popsala své zkušenosti s knihou o historii města Lyon z roku 1696. Poznamenala, že každá z částí knihy má vlastní stránkování: některé s číslovkami arabskými, jiné s římskými. Jednotlivé části po sobě nejdou chronologicky, a v digitální formě je proto těžké se orientovat. Z mé vlastní zkušenosti mohu potvrdit, že digitální forma je dobrá, když si potřebuji potvrdit, že se jistý fakt nachází na té které straně a je velmi příhodná, když se rozhoduji, zda je kniha příhodná k dalšímu studiu. Ale jestliže nějakou knihu čtu podrobně, chci mít možnost si nalistovat mapu ve chvíli, kdy si nejsem jistý, zda se pevnost nachází na jezeru Ontario nebo jezeru Erijském. Nebo si nalistovat poznámky na konci knihy ve chvíli, kdy si chci ověřit, jestli má autor pro tvrzení podložená fakta. Anebo se podívat do obsahu, abych si připomněl dějovou linii k obrázku, který jsem viděl před 100 stranami. A to ani nezmiňuji informace ukryté v kvalitě použitého papíru, vazbě, velikosti... které digitální kopie neposkytuje. Je možné, že další generace čteček už tyto nedostatky podchytí, ale prozatím se musíme obejít bez nich.

Rád bych zde zmínil potenciální neúmyslné následky digitalizace. Administrátoři NYPL doufají v minimalizaci nepříjemností spojených s uložením fyzických svazků na detašovaném pracovišti tím, že se snaží odesílat ty knihy, které již byly digitalizovány. Americký výbor učených společností (The American Council of Learned Societies) mezitím sestavil seznam vysoce kvalitních digitalizací 3.500 knih, které byly učenci označeny jako ty nejdůležitější pro jejich obory, a NYPL má do této databáze vzdálený přístup. Zde nastává paradox: těch 3.500 knih v databázi společnosti jsou výsledkem konsenzu, který předvídá, že zájemce si pravděpodobně bude chtít tyto knihy přečíst od začátku do konce – a právě proto jsou ohroženy tím, že budou digitalizovány a z pobočky zmizí do externího skladu. V případě malých knihoven bez možnosti takových skladů hrozí nebezpečí, že se originálů zbaví zcela.

Nicholson Baker si vysloužil výsměch, když naříkal nad první obětí digitalizace v knihovnách: zrušení lístkových katalogů. Katalogizace je ale přece přesně ten typ činnosti, kterou počítač vykonává mnohem lépe než kartičky a psací stroj. Aspoň to byste tak nějak přirozeně čekali. Když NYPL v 70. letech poprvé zavedla on-line katalog, nebyly v něm indexovány všechny knihy. Po čtyřiceti letech tam indexovány stále nejsou. Píšu si blog nazvaný Parolodě všechno ničí (Steamboats are ruining everything). Titul jsem převzal z knihy The Tipping of Tom Pepper, kterou napsal přítel Hermana Melvilla v roce 1847. On-line katalog NYPL tuto knihu neobsahuje. Ale vím, že knihovna ji vlastní, tedy aspoň její první svazek; půjčil jsem si ho v úterý jen proto, abych se ujistil, že mě paměť neklame. Ručně psaný záznam pro tuto knihu je možné najít ve vázaných svazcích nyní již zrušeného lístkového katalogu. Stejně tak je možné najít záznam sedmisvazkového díla Johna Spencera Bassetta z roku 1926 nazvaného Korespondence Andrewa Jacksona, které se v on-line katalogu také neobjeví, tedy pokud nejste dost mazaní, abyste ho hledali pod názvem celé série, Carnegie Institution of Washington Publication number 371. Což, ani pokud jste referenční knihovník, nemusíte vědět.

Knihovna měla celá desetiletí na to, aby svůj on-line katalog vylepšila. Namísto toho před pár lety přišla s vylepšenou verzí, do které byla zapojena sociální média, a kterou (mezi čtyřma očima) samotní pracovníci knihovny doporučují spíše neužívat. Ale dobrý on-line katalog je možnou realitou. Ten Harvardovy univerzity je vynikající, často ho používám, abych našel tituly v NYPL jakousi triangulací metadat. Nicméně nepřesnosti v on-line katalozích se šíří. Pokud jste někdy v Google Books, Open Library nebo v Internet Archivu hledali konkrétní svazek vícesvazkové série – třeba konkrétní rok Napoleonovy korespondence – možná jste narazili na problém, že tyto zdroje nedokáží rozlišit jeden svazek od jiného, tedy pokud osoba, která prováděla skenování nebyla dostatečně prozíravá, aby na konec názvu umístila číslo svazku jako vodítko.

Bádání probíhá samozřejmě i v malých veřejných knihovnách, které se musejí zbavovat starých knih proto, aby udělaly místo knihám novým. Před třiceti lety, když jsem jako teenager působil v naší místní knihovně, knihovníci knihy vyřazovali podle dat vrácení. Takže pokud na zadní straně knihy nebylo moc razítek, nebo jestliže všechna data vrácení byla už hodně stará, knihu vyřadili. Jedna z knihovnic se ani moc nesnažila skrývat svou sabotáž: s razítkem v ruce procházela regály a označovala své oblíbené tituly, aby to vypadalo, že byly nedávno vypůjčeny. Jak vysvětlovala, prostě by nepřenesla přes srdce, kdyby musela tyto knihy vyřadit, přestože nebyly vyloženě populární. A během celé kauzy okolo NYPL jsem dostával e-maily od knihovníků, kteří se báli, že taková sabotáž je možná i dnes. Počítače dobře vědí, kdy si kniha nezaslouží své místo na regálu, a knihovník z masa a kostí už takhle nadržovat knihám bez výkonu nemůže. Tito knihovníci se bojí, že v knihovnách, kde je kladen důraz na efektivitu, vytlačí best-sellery klasiku, a náruživý a zvídavý čtenář v knihovnách nenalezne nic než zábavu.

Na co jsem chtěl tímto výstupem poukázat je fakt, že nové možnosti digitálního věku jsou někdy zaváděny jen proto, že se to právě nosí, a jsou zaváděny i v knihovnách. Digerati právě teď slyší na vše, co znamená moc a peníze. A když se jim zachce ničit, budou ničit. Proto prosím buďte opatrní.

Poznámka: Text byl publikován 29. října 2012 na blogu autora a byl převzat s jeho svolením.
Crain, Caleb; Farkas, Pavel. Jak může digitalizace škodit bádání. Ikaros [online]. 2012, roč. 16, č. 12 [cit. 21.10.2014]. Dostupný na World Wide Web: <http://ikaros.cz/node/7773>. urn:nbn:cz:ik‐007773. ISSN 1212-5075.
Průměr: 4.7 (hlasů: 13)

automaticky generované reklamy