Informační systémy a služby v Čechách: jak vstoupily do počítačového věku a jak se vyvíjely - 2. část
Než navážu na v první části tohoto memoáru zmíněný opravdu průkopnický státní výzkumný program s tajemným kódovým označením L-1-09, udělený ve druhé polovině 60. let centrální státní vědecko-informační instituci - UVTEI, musím se jako absolvent knihovnicko-informačního oboru a současně bohemistiky vrátit k tehdy u nás i v zahraničí velmi významnému směru výzkumu a vývoje. Byly to nové teorie indexace (u nás díky Jiřímu Tomanovi označované jako "pořádání informací"), rozvíjené už pro využívání nových možností výpočetní techniky.
Nové selekční jazyky
V souvislosti se snahami modernizovat klasifikační systémy a zejména s předmětovým přístupem k indexaci vznikly pojmy "prekoordinace" a "postkoordinace" jako vzájemně protichůdné způsoby tvorby vlastních selekčních jazyků, jimiž se záznamy dokumentů, ukládaných už do počítačů, opatřovaly. Postkoordinace jako právě novou technikou vzniklý indexační směr samozřejmě stále více převažovala a uplatňovala se nejen v systémech založených na unitermech, klíčových slovech či deskriptorech v tezaurech, ale i v klasifikačních systémech, kde se uplatňovala metoda fasetizace, jejíž principy dlouho před dobou počítačů vymyslel slavný Ind Shiyaly Ramamrita Ranganathan (ve dvacátých letech minulého století). Nejvýznamněji se už od začátku 50. let v oblasti výzkumu a vývoje nových metod indexace v Evropě prezentovala skupina britských knihovníků a informačních pracovníků, označovaná jako London Classification Research Group. Sdružovala řadu velmi významných osobností v oboru v mezinárodním měřítku. Mohu připomenout např. dodnes uznávaného už klasika moderního pojetí informační vědy Briana C. Vickeryho, Douglase. J. Fosketta, s nímž jsem se měl později čest blíže spřátelit, Dereka Austina, Erica Coatese, Jasona Farradana, Roberta Fairthorna, Barbaru Kyleovou nebo Jacka Millse.
Návazně na diplomovou práci z roku 1961, v níž jsem pro sebe objevil jako nosné téma dialektický vztah předmětového a systematického principu pořádání informací (byla o předmětových rejstřících k systematickým katalogům, ještě ovšem netknuta jakýmkoli povědomím o výpočetní technice), jsem se tím problémem začal po nástupu do prvního zaměstnání hlouběji zabývat. Uvítal jsem proto někdy v roce 1965 nabídku vedoucího katedry Jaroslava Drtiny, váženého znalce oboru v celé jeho tehdejší šíři, který právě vytvářel sborník teoretických prací na různá aktuální i historická témata knihovnictví a bibliografie. Asi si vzpomněl na můj ostřejší odborný střet při obhajobě diplomky s tehdy začínajícím asistentem katedry Josefem Strakou, který moji práci (jako asi svoji první) vedl a také oponoval. Docent Drtina mi přes úspěšnou obhajobu na jedničku při gratulaci se svým pověstným sarkasmem při gratulaci pošeptal: "Čeká vás vojna, tak nezapomeňte - Maul halten und weiter dienen!"
Napsal jsem tehdy poměrně obsáhlou stať, kde jsem vyložil možnosti lingvistického a také logického pojetí základu tvorby formalizovaného způsobu vyjadřování témat publikací původně klasickými předmětovými hesly. Jmenovalo se to "Kategoriový rozbor pojmů a stavba předmětového hesla" a vyšlo to ve "vědecko-teoretickém sborníku" Knihovna až v roce 1967. To jsem se už plně angažoval v projektu jednoho z našich prvních automatizovaných informačních systémů, kde jsem mohl svoji teorii stavby předmětového hesla, už pro počítačově zpracovávané rejstříky, využít do určité míry v aktuální praxi (o tom ale později). Drtina nebyl – na rozdíl ode mne a také tehdy už mého přítele a šéfa podplukovníka Štingla – příznivcem počítačů a na jedné společné schůzce s námi opět sarkasticky pronesl pro mne památnou větu: "Až potkám, pánové, v Praze toho vašeho deskriptora, tak před ním smeknu".
Rotované rejstříky z předmětových hesel
V té době se v Praze uskutečnilo už pod garancí Státního výboru pro vědu a techniku a čerstvě založeného UVTEI setkání našich a britských informačních odborníků. Z britské strany se pro mne stal nejvýznamnějším účastníkem shodou okolností Douglas Foskett. Díky Stanislavu Štinglovi, který patřil do naší odborné špičky spolu s Jiřím Tomanem, Augustinem Mertou, Karlem Havlíčkem (abych jmenoval alespoň jádro naší reprezentace) jsem s touto skvělou osobností mohl prožít odbornou i společenskou debatu postupně ve třech známých pražských pivnicích. Douglas, jak si přál, abychom ho oslovovali, si tuto exkurzi upřímně užil a od té doby trvalo naše přátelství, i když s velmi zřídkavými setkáními ať už v Praze nebo v Londýně. Během té první debaty, když jsem se mu svěřil se svým zájmem o "subject heading" řekl: "Rudolf, you must read Eric Coates" a bezprostředně po svém návratu domů mi jeden exemplář Coatesovy nové knihy o tomto způsobu indexace poslal. Coatesovi už šlo o stavbu hesla pro počítačem zpracovávané rejstříky typu KWOC (keywords out of content), oproti KIWC mnohem sofistikovaněji stavěné a později k téměř dokonalosti přivedené Derekem Austinem v Britské národní bibliografii ve slavném projektu předmětových rejstříků pod názvem PRECIS. Pro mne bylo povzbuzující, že se hesla stavěla také na základě kategoriové analýzy pojmů a PRECIS vešel do dějin počítačových rejstříků jako asi nejsofistikovaněji tvořený a dlouho využívaný v rámci první mimoamerické aplikace systému MARC (BNB MARC) už od roku 1969. Pro indexátory v BNB tato metoda ovšem představovala noční můru, protože museli "ručně" na vstupu v jednom markovském poli jednotlivá slova hesel správně dle stanovených logických kategorií označovat indikátory a identifikátory, jak to ten slavný komunikativní formát vyžaduje. Odměnou za toto úsilí byly pro uživatele z hlediska vyhledávání velmi návodné rotované předmětové rejstříky v tištěných přírůstkových číslech BNB.
Vliv Pražského jara 1968
Vraťme se ale do roku 1966, kdy se už dal z pozice nově založeného UVTEI a jeho dobře koncipovaného úseku výzkumu pod vedením Františka Bálka postavit aplikační výzkumný a vývojový program zaměřený kromě systémových a teoretických otázek vývoje oboru (významnou částí bylo i zkoumání nových selekčních jazyků) také na bázi prvních experimentů s využitím počítačů pro tisk informačních, resp. bibliografických oborových zpravodajů. Jak se v průběhu následujících čtyř let ukázalo, vzniklo takových experimentů v Československu téměř dvacet a nešlo už jen o sovětské minsky a naše tesly, ale také o švédské datasaaby a dokonce už i IBM, ICL, Hewlit Packard a další typy amerických či britských počítačů. Ve druhé polovině 60. let došlo totiž i v knihovnictví a VTEI k jisté renesanci intelektuálních a demokratických hodnot, která vyvrcholila známým Pražským jarem 68. Dovezly se nejen západní počítače, ale také nové odborné časopisy a mohlo se dokonce vycestovat na Západ. I když cestám učinila invaze vojsk Varšavské smlouvy v srpnu 1968 přítrž, počítače a literatura (a také navázané kontakty) už naštěstí zůstaly. Z oněch experimentů, sledovaných a také už financovaných L-1-09, jsem měl příležitost se alespoň částečně seznámit s několika pozoruhodnými. Kromě už zmíněného projektu MINSK-ARDIS Jelínka a Stibitze zde musím zmínit ještě dva významné, i když provozně nerealizované projekty, a jeden dokonce zprovozněný a z mého osobního hlediska významný svým tvůrcem, který se pak načas stal mým přímým šéfem. O tom ale později...
Jako přímo grandiózní se tehdy jevil projekt nazvaný svým tvůrcem, Jaroslavem Závadou, tehdy pracovníkem Státní knihovny ČSR, SOKRATUS. Zahrnoval dílčí projekty automatizace souborného katalogu, národní bibliografie, katalogu Státní knihovny a jejího výpůjčního protokolu a snad i akvizičních procesů. Samozřejmě se vzhledem k dosažitelnému technickému i personálnímu vybavení Státní knihovny (ta neměla jakýkoli počítač ještě ani o dvacet let později) nemohl realizovat. Ale existoval ještě další, jistě významný projekt, který dospěl do stadia experimentů, a to automatizace České národní bibliografie. Stáli za ním, jak jsem už v první části tohoto memoáru uvedl, tehdejší řídící pracovníci Národní bibliografie Zdeněk Franc a Blahoslav Kovář. První dopadl velmi zle v čistkách po vstupu vojsk, druhý se uplatnil jako docent a tvůrce řady učebnic o selekčních jazycích na naší katedře, kterou opustil až po roce 1989. Ten projekt byl významný nejen tím, že šlo o velký a významný státní bibliografický systém, ale zejména předpokladem v tehdejších našich podmínkách přímo revoluční techniky počítačového tisku v češtině. Orientován byl na tehdy u nás asi nejvyspělejší, z vídeňské Mezinárodní atomové agentury dovezený programový systém GIPSY pro IBM. Přes několik experimentů se však ani tento projekt nedostal a po roce 1969 nenápadně zanikl.
Mne zaujal zejména projekt automatizace tehdy dost typického oborového dokumentačního systému v geologii, vedený v Brně inženýrem Jiřím Foglem. Ten se, podobně jako tehdy i já, podrobně zabýval logikou stavby indexace v dokumentačních záznamech a hned to prakticky zkoušel ve svém projektu, nazvaném ASTI, orientovaném na už vyspělejší počítač, než byl náš MINSK22, a to na švédský DATASAAB D21. Své výzkumy také publikoval a na tom základě jsem se s ním začal přátelit (zajistil jsem mimo jiné jeho pozvání na první československou bibliografickou konferenci do Olomouce). V roce 1968 přešel už do výzkumného útvaru UVTEI a stal se tam pak mým prvním šéfem, když jsem tam v roce1969 nalezl nové, velmi zajímavé angažmá a zejména také skvělé nové kolegy. K tomu se ale ještě později vrátím.
Už tři roky předtím se mi, ovšem shodou okolností a náhod, dostalo příležitosti, kterou jsem nemohl nechat nevyužitu. Jako vedoucí dokumentace jsem měl možnost využívat jako dokumentátory z cizích časopisů také každoročně několik z pár desítek absolventů vysokých škol, kteří narukovali na jednoroční prezenční službu do Vojenské politické akademie. Nevím, jakými cestami se v rámci rozdělování branců v mašinérii armády dostávali právě sem, ale většinou šlo o jakousi elitu, ať už co do kádrového původu (část jich byla absolventů moskevské vysoké diplomatické školy), nebo intelektuálních schopností (např. dnes slavný shakespearovský překladatel a univerzitní profesor Martin Hilský nebo přímo tehdy "mí" dokumentátoři, jako ekonom Josef Kreuter, po roce 1989 náš první velvyslanec u Evropské unie v Bruselu, či arabista a angličtinář Jiří Tomek, později spisovatel skvělých dětských knížek). Protože jsem se, jak uvádím v prvním dílu tohoto memoáru, už v roce 1965 začal zajímat o počítače a jejich možné využití v dokumentaci a byl jsem v tom podporován svým šéfem, Stanislavem Štinglem, vyžádali jsme si přidělení pokud možno také absolventů techniky, kteří by s počítači už něco uměli.
Projekt KOMPAS
A náhoda nám přála. Na podzim roku 1966 ke mně do dokumentace narukovali dva neobyčejně nadaní mladí programátoři - Jiří Budil a Dušan Badal. Zatímco druhý z nich byl spíše uzavřený a než jsem se s ním mohl blíže poznat, zmizel mi nakonec definitivně z kontaktu emigrací do USA (kde pak, jak jsem se doslýchal, dosáhl jako informatik doktorského titulu i dobrého postavení v zaměstnání), Jiří Budil se rychle v prostředí našeho civilního veselého a spřáteleného kolektivu mužů a žen všech generací aklimatizoval a jako čestný, spořádaný a tehdy téměř magickými (počítačovými) znalostmi obdařený voják k nám dobře zapadl. Byl to ten Jiří Budil, který se nakonec stal hlavním tvůrcem nejvýznamnějšího softwaru pro československou soustavu VTEI v 70. a 80. letech minulého století. Já ho pokládám za jednoho z mých nejvzácnějších kamarádů, i když nás, po řadě let společné práce naše individuální osudy zejména po roce 1989 velmi vzdálily. Bylo rozhodnuto, hlavní výstupy z dokumentace ve VPA KG, totiž tištěný vojensko-politický informační zpravodaj a současně tištěné lístkové záznamy do kartoték pro rešerše, se budou zpracovávat s pomocí počítačové techniky. Přihlásili jsme se do programu L-1-09 a získali peníze na první přístrojovou techniku, což byly děrovače pětistopé děrné pásky Consul. Začalo mé první velké dobrodružství projektanta automatizovaných informačních systémů...
S orientací ve směru typu výpočetní techniky bylo předem jasno: armáda disponovala několika stroji MINSK22, pro který už byl právě v jejím pražském výzkumném vojenském ústavu vyvíjen slavný systém ARDIS, geniální český informatik Jaroslav Formandl, vytvořil pro české programátory onoho už tehdy předpotopního sovětského stroje překladač MAT6, čímž bylo možné využít anglickou abecedu a jazyk v podstatě už na bázi programování, jaké se pak v jazyce Assambler používalo i na vyspělých počítačích 3. generace při snaze urychlit složité operace s nároky na centrální procesorovou jednotku (CPU) počítače. Mým novým spolupracovníkům Budilovi a Badalovi jsem systém zadal tak, že na výstupu bude v každém přírůstkovém číslu, obdobně jako dosud, tištěná sestava anotovaných dokumentačních záznamů, tehdy ve tvaru předepsaném klasickou normou ČSN, utříděná podle specializované klasifikace, kterou jsem pro ty účely vytvořil, a k ní rejstříky autorský, KWIC a předmětový typu KWOC z hesel, která budou na vstupu tvořena dokumentátory podle mnou vytvořeného modelu kategoriového rozboru pojmů, ovšem v poněkud zjednodušené formě oproti později vyvinutému způsobu pro BNB v rejstříku PRECIS. A jako vedlejší produkt budou sestavy základních záznamů tištěny tak, aby se mohly rozřezat do lístků pro stálé doplňování našich rešeršních kartoték.
Kolegy programátory to upřímně zaujalo, zejména můj způsob řešení předmětového rejstříku, a s chutí se pustili do programování. Jako u každého podobného projektu záleželo také na jeho názvu. Napadlo mě vyjít z myšlenky kombinace předmětového a systematického způsobu indexace a navíc na výstupu kombinace různých druhů sestav, a tak vznikl akronym KOMPAS (KOMbinovaný Pořádací Automatizovaný Systém).
Zahájili jsme pochopitelně konzultační rozhovory se zkušenějšími kolegy, např. v IKEM s kolegou Tschernosterem, ale v rámci armády s tvůrci už tehdy experimentálně úspěšně ověřeného systému ARDIS Vladimírem Stibitzem a Petrem Jelínkem. Tvůrci ARDIS měli zájem o můj způsob řešení rejstříku KWOC, který jsem jim bezelstně vyložil, zatímco si mí programátoři odnesli základ Stibicových a Jelínkových programů a založili svůj systém právě na jejich bázi. Bylo nasnadě, že náš systém bude jakousi nástavbou na ARDIS, ale jeho tvůrci s něčím takovým nepočítali. Jenomže ve své nevinnosti a na druhé straně vlivem racionálního myšlení, které je i dnešním programátorům vlastní, vytvořili už tehdy problém autorské ochrany software v rámci Československé socialistické armády, a to mezi dvěma jejími významnými akademickými ústavy - VPA KG a VÚ 401 v Braníku. A tak hned první fáze vývoje systému, který se měl zanedlouho z experimentální fáze transformovat (jako tehdy určitá výjimka z obdobných prvních experimentů v Čechách a na Slovensku) do rutinního provozu, byla poznamenána ostrým sporem, který naštěstí uhladili nejvyšší vojenští náčelníci. Do provozu dospěl KOMPAS stejně až po dlouhých měsících práce na programech a ověřování v armádních výpočetních střediscích kromě Prahy hlavně v kartografickém ústavu v Dobrušce. Jak to potom komentoval jeden z náčelníků VPA KG, nedočkavě vyhlížejících první výtisk zpravodaje s novým způsobem rejstříků, až dospěli jsme k tomu "teprve pod hrozbou okupačních vojsk" – v srpnu 1968, po dosti dramatickém nočním vojenském obsazení Akademie.
Meze automatizace (nejen) v československých podmínkách 60. let
První experimentální projekty na tehdy u nás dostupných počítačích se musely potýkat s dnes neuvěřitelnými technickými omezeními. Především se pracovalo pouze v dávkovém (off-line) režimu. Tím byly prakticky vyloučeny funkce retrospektivních rešerší, byť na ně systémy, jako třeba ARDIS, sázely jako na hlavní výdobytek automatizace. Mimochodem - toto omezení se stalo v oněch letech předmětem velké kritiky slavného projektu MARC Henriette Avramové. I ona musela ještě ve druhé polovině 60. let minulého století postavit systém tak, že se kromě ukládání nových katalogizačních záznamů do "nitra" počítače Kongresové knihovny navíc poměrně sofistikovaným způsobem připravoval i tisk lístkových záznamů v historicky daném formátu, a to v tolika exemplářích, do kolika katalogových sestav se stále musely vřazovat. Vzpomínám si na rozhořčený článek v dobovém americkém knihovnickém tisku, který stavěl skvělé "on-line" selekční možnosti současně desítek čtenářů v sálech plných skříní se šuplaty plnými jmenného, předmětového, systematického a tuším i názvového katalogu největší světové knihovny, oproti zcela s tím nesouměřitelnému pokládání dotazů přes nejprve jejich naděrování do děrných štítků (tehdy převažujícímu způsobu ukládání dat před jejich konverzí na magnetopásková média) a poté jejich uplatnění do vyhledávacího procesu, způsobem připomínajícím skvělý český film "Jáchyme, hoď ho do stroje!" Zásadní náskok paní Henrietty oproti nám byl ovšem v možnosti ukládat skutečně celý katalogizační záznam se všemi poli a údaji v nezkrácené formě a v celém potřebném rejstříku všech možných znaků, nejen abecedy, a také už téměř polygrafický tisk na počítačových tiskárnách. A teprve až v roce 1970, kdy jsme vyhodnocovali dosavadní československé experimenty s automatizací katalogů a hlavně dokumentačních systémů, se nám ozřejmil hlavní význam souběžně s našimi pokusy vyvinutého systému MARC – komunikativní formát katalogizačního, resp. bibliografického záznamu, a tím možnost komunikace celých souborů záznamů ve strojem čitelné formě mezi různými počítači. Vznikla tak obrovská racionalizační vlna v katalogizaci a zejména pak i v dokumentaci. Ale o tom až později...
Využívání funkcí Booleovy algebry v dotazu se zpočátku jevilo přirozeně jako hlavní přínos počítačů pro zpětnou selekci informací, vyjádřených novými selekčními jazyky, založenými na řízených slovnících typu tezaurů, nebo na klíčových slovech. Zdůrazňoval se nový princip syntaxe v selekčních jazycích: postkoordinace. Jenomže předmětové selekční jazyky byly často omezeny povolenou délkou slov a třeba také délkou názvů dokumentů, nebo omezeným počtem znaků pro vyjádření anotací či abstraktů. Např. ARDIS povoloval jen šest znaků v alfanumerických výrazech, ale naopak až devět míst pro vyjádření číselných údajů. To jsme v případě kategoriové koncepce hesel museli řešit speciálními pravidly komprimace výrazů na pět písmen a jednu číslici označující vždy jednu z pěti předepsaných kategorií (věc, vlastnost, proces, vztah a oborové hledisko). Pro výstup rejstříku se slova podle převodového slovníku dekomprimovala. Tištěné, různě utříděné výstupní sestavy jako východisko mohly využívat pouze velkých písmen anglické abecedy. Překonání této bariéry se stalo v L-1-09 dokonce samostatným předmětem výzkumu, řešeným i Jiřím Tomanem, zaměstnaným tehdy v rámci specializovaného týmu spolupracujícího s knihovnou Československé akademie věd a připravujícím novou koncepci vědecko-informačních služeb v akademii.
Brzy se ukázalo, že to, co je pro realizaci projektů automatizovaných systémů nejen v knihovnictví a VTEI nejnáročnějším procesem, je příprava a vlastní ukládání vstupních dat pro následné počítačové zpracovávání. Počítače a jejich systémy u nás nebyly kompatibilní, což vylučovalo racionální kooperaci třeba v rámci knihovních sítí či oborově spřízněných informačních středisek. Pochopili jsme, a na tom byl i náš projekt KOMPAS postaven, že z jediného vstupu je třeba v systému naprogramovat vždy co nejvíce různých druhů výstupů a tím plnit co nejvíce informačních funkcí. To ostatně platí dodnes...
[Pokračování příště]