Digitalizace, data, capta
Milé čtenářky a milí čtenáři Ikara, ačkoli nastávají prázdniny a vy se jistě těšíte, jak jich příjemně využijete k odpočinku a zotavení, já si přece nedám pokoj a obracím se na vás se svým digitalizačním sloupkem. Myslím si totiž, že digitalizace v knihovnách pokračuje příliš rychlým tempem, než abychom ji jen na okamžik pustili ze zřetele. Je to samozřejmě trochu nadsázka, ale mohlo by se stát, že se po prázdninách vrátíme a všechno bude jinak. Je tedy dobré alespoň jedním okem sledovat naše téma i nyní, kdy se chceme poněkud odpoutat od svého povolání a zaměstnání.
Když mluvíme o digitalizaci, musíme mít na paměti rozdíl mezi dokumenty (i když to jsou pouhé quasidokumenty!) digitálními a digitalizovanými, tzn. mezi těmi, které byly původně vytvořeny pro elektronicko-digitální prostředí, a těmi, které do elektronicko-digitálního prostředí byly převedeny z prostředí tradičního a historického. Nemám teď na mysli pouze to, že tyto dva typy dokumentů pocházejí z různých dob a epoch, ale něco praktičtějšího a pragmatičtějšího: tvorba těchto dvou typů dokumentů se částečně liší s ohledem na přípravu dat, která jsou nutná k jejich vzniku a zhotovení. Při přípravě dat nejde o úzce chápanou bezpříznakovou technickou záležitost, nýbrž o něco podstatně složitějšího a dosti obtížně uchopitelného. Naše civilizace je už taková, že nepřistupuje ke skutečnosti přímo, ale převážně prostřednictvím dokumentů, ať už vnímáním jich samých, nebo reprodukcí jejich obrazů a modelů v mysli. Jestliže však na nás skutečnost působí téměř výhradně takto zprostředkovaně, potom příprava dat pro dokumenty je zcela fundamentální věcí: v přípravě dat si svou skutečnost vlastně ztvárňujeme, konstruujeme, interpretujeme, jak je komu libo. Někteří nadšenci sice tvrdí, že informační společnost či společnost znalostí, pro kterou bude/je typické elektronicko-digitální prostředí, se obejde bez prostředníků, je to však evidentně nesprávné, je to jen mámivý sebeklam, protože z přípravy dat se vymknout nemůžeme.
A nevyhneme se ani zpracování dat, jestliže jsme civilizací dokumentů. Při digitalizaci tudíž nejde o pouhé poskytování, o jiný způsob půjčování, jak by to rádi viděli někteří tradičně myslící knihovnicko-informační pracovníci, ale o produkci (u dokumentů původně elektronicko-digitálních) či re-produkci (u dokumentů tradičních a historických). To nám začíná být poměrně dobře jasné v případě obrazových dat a obrazových kopií, jak dokládají příspěvky Stanislava Psohlavce [4] a Adolfa Knolla [5] na letošním Inforu [6]. Myslím, že k tomu nemám co dodat. Méně však to chápeme u dat, kterým jsme si navykli říkat textová. Někdo by mohl říci, že na tom tolik nezáleží, protože v elektronicko-digitálním prostředí se prosazují především multimodální dokumenty, kterým se zkráceně říká multimédia, takže na dosavadní dominanci textu můžeme zapomenout, čímž problém sám od sebe zmizí. Jenže takhle jednoduše to nejde. Pouhý obraz koně a jeho hlas, resp. jeho reprodukce nám neřeknou, zda míníme právě tohoto koně, nebo koně vůbec atd. Abychom si mohli své mínění ujasnit a jít případně dál k informaci, znalosti a poznání, k tomu potřebujeme slovo, resp. text. Digitalizací se nám tedy pouze vrací to, na co naše civilizace už dávno skoro zapomněla, totiž rozporné napětí mezi ikonicitou a verbalitou na jedné a oralitou a textualitou na druhé straně. Příprava dat, kterou provádíme, by na to měla brát ohled.
Nejprve je dobré zastavit se nad tím, odkud plyne ono nadšení pro multimodální, netextuální dokumenty. Obracím vaši pozornost, drahé čtenářky a drazí čtenáři, k mému minulému sloupku, v němž jsem se pokusil načrtnout problematiku myšlenkových modelů a jejich změn. Spojíme-li si to, můžeme pak říci, že až dosud dominoval model totality prezentovaný jako textualita. Postupně však dospíváme k poznání, že uspokojivější pro nás by byl model univerzality. S nadějným nadšením se tedy vrháme na multimodální dokumenty, abychom - jako v příkladu s koněm - zjistili, že to není vše, že musíme ještě řešit otázku vztahu univerzality a partikularity. Úhrnem z toho plyne, že musíme jinak než dosud porozumět tomu, co je text, pokud chceme vybříst z těchto potíží. Proto se všude a vždy snažím zdůrazňovat nepominutelný a zásadní význam textových dat a jejich přípravy, protože právě tam je zakopán pes.
My totiž, když řekneme text, vidíme před sebou, a to i vnitřním zrakem, téměř výhradně jen lineární text, který právě svou jedno-jednoznačností je zdrojem totality. Avšak to v žádném případě není jediná možnost pro nás. Před časem jsem se pokusil postihnout takřka nedozírný význam hypertextu [7] v tomto myšlenkovém kontextu. A když řekneme hypertext, hned se nám vybaví značkovací jazyky; já tu teď mám na mysli spíše SGML a XML než HTML, protože ty kromě formální strukturace umožňují i strukturaci sémantickou. Právě o ni totiž jde. Znovu tady upozorňuji na evropský projekt MASTER [8], který se těmito otázkami jaksi druhotně také zabývá. Myslím, že při práci na jeho řešení i při pokusu o další aplikaci jsme dospěli ke zcela zásadnímu zjištění: na rozdíl od tradiční práce s popisnými daty prezentovanými v lineárním textu podle přijatých zásad či pravidel, kdy je možný jen jeden způsob vyjádření, nyní, při použití značkovacího jazyka, jsou při dodržení stále téhož standardu možná vyjádření různá. To ve svém důsledku znamená, že skutečnost je možno racionálně a racionalizovaně, tj. při uchování standardu, nahlédnout na různý způsob, tedy že se nám podařilo odstranit právě onu prekérní jedno-jednoznačnost. Možnost tu tak je, my se však musíme naučit jí využívat.
Práce s takovou možností je především otázkou základního náhledu a přístupu, zkrátka předrozvrhovací noeze, abych tak řekl. Znamená to totiž, že při digitálním zpracování a zpřístupnění tradičních a historických dokumentů my nereprezentujeme prostě skutečnost tak, jak je, ačkoli jsme to pod vlivem objektivistické a pozitivistické metodologie toužili dělat a leckdy se i domnívali, že to opravdu činíme. My pouze prezentujeme naše (různé) pochopení skutečnosti. Jedno-jednoznačnost se proměňuje v pouhou jednoznačnost: tato naše prezentace musí být smysluplně zdůvodnitelná (jednou "jedno"), avšak není ta sama (podruhé "jedno"); identita skutečnosti a odrazu - na níž si tolik zakládal nejenom marxismus, ale i pozitivismus a která ve svém důsledku vedla k rušení skutečnosti a jejímu nahrazování oním "odrazem" - se ukazuje jako neplatná a nesmyslná. Ještě sice musíme tohle zjištění pořádně zažít, ale nebojme se, pochopením toho, co říkám, jsme první krok již učinili, jen se nesmíme bát jít dál.
Tato cesta dál nás vede k dosud málo obvyklému rozlišení: my stále hovoříme o datech (která snad chápeme jako objektivní základ interpretované informace), popravdě však se nám tato data rozpadají na "data" a "capta"1. "Data" jsou záležitostí vnějšího, zatímco "capta" vnitřního světa. "Data" tedy nejsou ani tak složkou tzv. objektivní skutečnosti, jak by se mohlo myslet, ale potenciálním rezervoárem ve virtuálním světě elektronicko-digitálního informačního, komunikačního a znalostního prostředí, z nějž rastrem interpretačních modelů výběrem vznikají "capta". Pokud se chceme tohoto rozlišení ušetřit jako příliš minuciózního a scholastického, můžeme prostě říci, že sama data jsou konstituována interpretací2, že nejsou něčím jednoduše samozřejmým, jak jsme si mysleli. Když to dovedeme až do konce, dobereme se toho, že otázka "jak" něco dělat není sice bez významu, ale že rozhodně není první na řadě. Nejprve totiž musíme rozvážit "proč" vůbec něco dělat, pak "co" to má být a teprve poté "jak" na to. I v tom je změna oproti našim navyklým způsobům, nicméně se jí neubráníme.
Odvážné čtenářky a krásní čtenáři, když jste se mnou vydrželi až sem, nebudu dále zneužívat vaší dobroty. Slibuji vám však, že vás nenechám na pokoji a příště vás zase budu trápit.