Sorry, you need to enable JavaScript to visit this website.

Digitalizace, interpretace a semistrukturovaná data

Čas nutný k přečtení
6 minut
Již přečteno

Digitalizace, interpretace a semistrukturovaná data

0 comments

Drahé čtenářky a drazí čtenáři, i uprostřed prázdninové pohody si vás dovolím vyrušit svými úvahami o digitalizaci. Jestliže jste se odhodlali otevřít Ikaros i v této době, jistě to se mnou vydržíte, i když budu zatvrzele pokračovat v tom, co jsem se vám pokoušel sdělit minule a předminule. Myslím totiž, že to jsou pro digitální prostředí a pro práci v něm zcela zásadní věci.

Mezi rukopisnými pracovníky, kteří se věnují ať už tradiční nebo elektronické katalogizaci, někdy probleskne skeptické rozpoznání, že katalogy nejsou využívány: zařadí se na regál a pak už je nikdo neotevře, říkají. Napsal jsem někdy a míním tím zřídka kdy, protože takto uvažují jen ti odvážnější, kteří začínají chápat, že katalogy tu nejsou jen pro (ostatní) katalogizátory, ale také - ba hlavně - ještě pro někoho dalšího. Příznačné ovšem je, jak tito nemnozí odvážlivci své prozření zařazují do dalšího kontextu. Ani oni totiž vůbec nezapochybují o tom, že tak, jak katalogizaci vytvořila tradice posledních pozitivistických a postpozitivistických generací, se to prostě dělat "má" a "musí". Ani na okamžik si nepřipustí, že se nemusí nutně hovořit o "literárních vědcích" a "uměnovědcích", kteří pečlivě zpracované katalogy opomíjejí, a tak devalvují náročnou práci katalogizátorů. Ani ve snu je nenapadne, že vytvářejí takové produkty, které nemají "přirozené uživatele", třebaže takto postavená otázka vůbec není nesmyslná. A tak hovoří o uživatelích, aniž se s nimi vlastně dokáží setkat a shodnout. Řekněme, že nedokáží svou činnost customizovat, a to ani v tradičním tištěném, ani v novém elektronicko-digitálním prostředí. Myslím, že to není problém, který bychom mohli jen tak pominout.

Ukazuje se na něm totiž, že digitalizace v širokém smyslu, v jakém o ní v tomto sloupku výhradně hovořím, nemůže být pouhým bezpříznakovým počínáním, neboť tak by jenom reprodukovala naznačenou neblahou situaci; a na to je to zábava příliš pracná a příliš drahá. Musíme se tedy v první řadě ptát, čím je dána zmíněná "neužitečnost" rukopisných katalogů, která je obzvláště paradoxní v době, která si libuje mluvit o "kulturním dědictví" a "kontinuitě idejí". Myslím, že nebude žádná pochybnost o tom, že "užitečnost" a "neužitečnost" katalogizace se ukazuje jako problém interpretace: nejde v první řadě o nezájem o rukopisy samé, ale o to, jak jsou prezentovány a jaký je jim takovou prezentací přikládán význam; spor není v první řadě o věc samu, ale o interpretaci jejího významu. "Katalogizátoři" a "uživatelé" zkrátka vidí rukopis tak rozdílnýma očima, že nakonec vidí něco úplně jiného. Domnívám se tudíž, nejspíš docela důvodně, že problém není ani tak v zájmu či nezájmu o věc, ale v zájmu či nezájmu o její konkrétní vidění.

A tak se nám rozjasňuje: otázka je, jaká data katalog zpřístupňuje, jaká může a má zpřístupňovat, protože "data" jsou vlastně "capta", jsou konstituována interpretací, jež spočívá v modelování svého objektu a celého systému, v němž se pak konkrétní objekty, nikoli jejich modely, pohybují. Objekt a systém, tj. katalogový záznam a katalog jako celek, jsou součástí lidského světa, světa umělého, světa kultury, tedy takového světa, který je kontingentní, nikoli nutný. V kontingentním, nikoli nutném světě nelze jednoduše mluvit o ideálních formách, k nimž by se mělo směřovat. Pokud bychom se o něco takového snažili, pak bychom se vztahovali ke sféře nepředmětného, nikoli předmětného; a nepředmětné je transcendentní, není zde, v této naší sféře. A tak tedy, jako není ve velkém možná spása skrze společnost, třebaže se nám to osvícenská tradice a její následovnice snaží namluvit, tak je také v malém nesmyslná představa, že by katalog rukopisů měl či vůbec mohl mít jednu jedinou vzorovou modelovou podobu. Tradiční katalogizátoři se matou, když takové podoby chtějí dosáhnout. Taková snaha je svéráznou obdobou "sociálního inženýrství", jež je specifickým vnucováním partikulárního zájmu celku, je vydáváním pouhého zurčitění za určitost samu. Není tedy divu, že dosavadní rukopisná katalogizace ztrácí rezonanci; naše myšlení se totiž postupně začíná ubírat jinými cestami, než jsou ty, na nichž byla založena.

Primární otázka se proto, jak vidíme, netýká konkrétních zásad či pravidel popisu, nýbrž toho, jak si poradit s objektem a systémem v kontingentním prostředí světa kultury. Ze zásadní kontingentní povahy kulturního prostředí plyne, že systém, který je v něm účelně a smysluplně uplatnitelný, musí být systémem "měkkým" a ne "tvrdým". Musí to být systém připouštějící různé možnosti, a to ve dvojím smyslu: jednak výběru, resp. tvorbě "capt", jednak interpretace informace z dat. Vícemožnostní přístup vylučuje snahu o důsledně strukturovaná data; z toho důvodu se také při rukopisné katalogizaci vcelku neuplatnily obvyklé knihovnické systémy, které vznikaly v etapě dominantní automatizace. Na druhou stranu by nebylo dobré se soustředit na čistě nestrukturovaná data, poněvadž to by bylo pouhou replikou lineárního textu tištěného prostředí, replikou neumožňující snadné vyhledávání a zůstávající v zajetí jedno-jednoznačnosti zásad a pravidel. Je třeba naučit se pracovat se syntézou obou aspektů, překonat rozpor mezi daty strukturovanými a nestrukturovanými. To dovoluje představa semistrukturovaných dat, která se začíná stále silněji uplatňovat. Není tedy od věci pokusit se ji aplikovat i na rukopisnou katalogizaci, resp. na všechny složky rukopisné práce.

Tím se dostáváme k systému (a jednotlivý objekt sám je systémem na úrovni recepce), který je jakousi kompromisní kombinací tradičních systémů databázových a dokumentografických. A tak ovšem odjinud přicházíme k využití značkovacích jazyků a jejich aplikací, o němž jsem se ve svých sloupcích již častěji zmiňoval. Tentokrát bych chtěl upozornit na TEI, (Text Encoding Initiative), aplikaci jazyka SGML/XML. Její manuál je sice nesmírně rozsáhlý a složitý, takže budí dojem nepraktičnosti a pro humanitně školeného člověka dokonce nepoužitelnosti. Nicméně je záhodno si uvědomit jednu zcela podstatnou věc, která normativně myslícím lidem zvyklým na zásady a pravidla a spoléhajícím se na ně namnoze uniká: nabídka tagů, elementů a atributů je fakultativní, nikoli obligatorní. Je to pouhý rezervoár pro vyjádření semistrukturovaných dat při práci s texty, který nemá smysl užívat najednou v úplnosti. Je to základ možnosti, jak přistoupit k vytváření nelineárního textu, o který nám tu jde, jak už jsme zjistili dříve. To opravdu stojí za zamyšlení.

V našich končinách je seznamování s možnostmi TEI teprve v samých počátcích. Proto je lepší vyhnout se detailům a složitostem a soustředit se na úplně základní věci. Zejména dvěma z nich bych přikládal prvořadou důležitost v souvislosti s tím, že je žádoucí, abychom se zbavili jediného vzorového modelu objektu. Jednak cíleným výběrem z tohoto rezervoáru elementů můžeme dosáhnout toho, že jedinou vnější věc můžeme pochytit větším počtem vnitřních předmětů, a tedy i v několika různých reprezentacích. To se zcela bezprostředně vztahuje k otázce "užitečnosti" a "neužitečnosti" rukopisných katalogů: diferencované skupině uživatelů či zájemců lze diferencovaně nabízet různé reprezentace, a tím dosáhnout toho, čemu se říká customizace. To je ovšem možné za jediné podmínky, totiž zbavíme-li se utkvělé představy, že "správně" rovná se "objektivně", rovná se "pravdivě"; zkrátka za podmínky, že přijmeme pluralitu cílů a účelů. A jelikož i při pluralitě cílů a účelů se budeme pohybovat v oblasti sémantiky a syntaxe jednoho značkování, zůstane zachována srozumitelnost a pochopitelnost. Myslím, že je nadějné a nosné se tomu věnovat. Jednak je možno i jeden vnitřní předmět vyjádřit v různých reprezentacích, když totiž využijeme možnosti vyjádření buď v elementu, nebo v atributu, jak dokládají mnohé příklady v manuálu. Tím lze dosáhnout jemných hledisek a jemných nuancí nad pluralitou předmětů. A také zde je to v rámci sémantiky a syntaxe jednoho markupu, takže se přes už dvojvrstevnatou pluralitu neztrácí ohled na univerzální úběžník. Tím spíše myslím, že to opravdu stojí za úvahu.

Milé čtenářky a milí čtenáři, vidíme, že možností je před námi mnoho, jen si s nimi umět poradit. Žádná z nich není apriorně správná nebo špatná, a tak je nutno nespoléhat na normy a učit se rozlišovat cíle a účely. To nám zatím sice příliš nejde, ale doufám, že se to nakonec obrátí k lepšímu.

Klíčová slova: 
Hodnocení: 
Zatím žádné hodnocení
UHLÍŘ, Zdeněk. Digitalizace, interpretace a semistrukturovaná data. Ikaros [online]. 2001, ročník 5, číslo 8 [cit. 2020-08-04]. urn:nbn:cz:ik-10768. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/10768

automaticky generované reklamy
registration login password