Digitální knihovna Český parlament v roce 2000
Digitální knihovna Český parlament [4] je projekt Parlamentní knihovny [5] a odboru informatiky Kanceláře Poslanecké sněmovny [6] Parlamentu ČR. Projekt si klade za cíl postupnou digitalizaci všech těsnopiseckých zpráv a parlamentních tisků od roku 1918 do současnosti, a výběrově i starších, a jejich zpřístupnění veřejnosti prostřednictvím Internetu. Projekt byl odstartován již v roce 1996 a postupně se v něm pokračuje. V současnosti jsou digitalizovány asi dvě třetiny z plánovaného množství dokumentů.
Metoda zpracování
Po celou dobu projektu se naše metoda digitalizace dokumentů nemění. Digitalizační pracoviště a vše, co s ním souvisí, se nenachází přímo v Poslanecké sněmovně, ale v externí firmě (dříve ve dvou firmách), která vyhrála výběrové řízení a zakázky pro nás zpracovává.
Digitalizované texty jsou finálně ukládány a zpřístupňovány ve formátu HTML, jehož soubory mají přijatelnou velikost, lze v nich dobře fulltextově vyhledávat, umožňují bezproblémovou tvorbu hypertextových odkazů a poměrně jednoduše lze z nich generovat různé indexy. Nevýhodou je, že HTML dokumenty nekopírují formát primárních dokumentů (jako např. PDF formát), a zejména pak také to, že při převodu textu z digitální podoby nelze zajistit stoprocentní bezchybnost konečného textu. To je bohužel věc, kterou není možné do určité míry příliš ovlivnit, přestože naše spolupracující firmy vždy udržovaly a i nadále udržují vysokou kvalitu. Z našeho pohledu je však pro nás stejně důležitější samotný obsah než formát, takže HTML plně splňuje naše požadavky.
Co všechno můžete v Digitální knihovně najít
Digitální knihovna obsahuje následující skupiny pramenů pojednávajících o dosavadní činnosti českých a československých zákonodárných sborů:
Historické těsnopisecké zprávy (těsnopisecká zpráva je doslovný přepis záznamů všech řečí pronesených v parlamentu) prvních schůzí Českého sněmu [7] z roku 1861.
Kompletně všechny těsnopisecké zprávy od roku 1908 do současnosti. Při té příležitosti bych chtěla upozornit, že do Digitální knihovny jsou průběžně ukládány také nejaktuálnější těsnopisecké zprávy [8], většinou jednu až dvě hodiny po pronesení ve sněmovně v době konání poslanecké schůze, a to ještě před autorizací jednotlivými poslanci. Tyto čerstvé informace jsou zpravidla veřejností nejvíce sledovány.
Parlamentní tisky (to jsou návrhy zákonů, mezinárodní smlouvy, státní rozpočty, interpelace, zprávy, stanoviska vlády, usnesení výborů, pozměňovací návrhy aj.). V současnosti se postupně digitalizují časová období po 1. světové válce a po roce 1990.
Stejně tak jako těsnopisecké zprávy tohoto volebního období ani aktuální sněmovní tisky se již nedigitalizují, ale ukládají do Digitální knihovny v elektronické podobě. Pouze ty, které není možné takovým způsobem získat (v převážné většině se jedná o interpelace a některé mezinárodní smlouvy nebo speciální zprávy) se budou dodatečně digitalizovat po ukončení příslušného volebního období.
Parlamentní tisky posledních tří volebních období jsou provázány s relační databází sněmovních tisků, což umožňuje najít ke každému tisku jeho plný text, historii projednávání ve sněmovně a v senátu, odkazy na příbuzné sněmovní tisky a také odkazy na místa v těsnopiseckých zprávách, kde se daný tisk projednával na schůzích, a na databázi výsledků hlasování.
Novější volební období Poslanecké sněmovny jsou navíc doplněna o další dokumenty, jako usnesení Poslanecké sněmovny, usnesení jednotlivých výborů, zprávy výborů, pozvánky na schůze atd. Tyto materiály rovněž nebyly digitalizovány z papírové předlohy, ale z textových souborů konvertovány do HTML formátu, ve kterém pak byly vystaveny na Internetu, nebo jsou již přímo získány a uloženy v textovém formátu a do HTML se konvertují dynamicky.
Zcela nedávno byly do Digitální knihovny přidány také některé starší zvukové záznamy [9] z jednání ve sněmovně, které jsme získali z archívu Českého rozhlasu. Jedná se např. o volby prezidentů nebo projednávání některých historicky důležitých zákonů. Zvukové záznamy jsou vystaveny ve formátu MP3.
K tomuto bodu bych chtěla připomenout, že v době konání schůze Poslanecké sněmovny je možné na Internetu sledovat přímý zvukový [10] a audiovizuální přenos [11] prostřednictvím systému RealAudio. Příslušné odkazy však nenajdete v Digitální knihovně, ale na stránce Dokumenty Poslanecké sněmovny [12].
Pár slov k vyhledávání v Digitální knihovně
Celá kolekce Digitální knihovny se každou noc indexuje a je možné v ní fulltextově vyhledávat [13].
K těsnopiseckým zprávám se automaticky generují časové rejstříky [14], které umožňují prohlížení těsnopiseckých zpráv po jednotlivých dnech.
V minulém roce jsme Digitální knihovnu ve všech volebních obdobích doplnili digitalizovanými jmennými a věcnými rejstříky (pokud byly k dispozici), které je možné si sice jen prohlížet bez přímé hypertextové vazby na příslušný dokument, ale zato mohou dobře posloužit jako inspirace, pokud předešlé fulltextové hledání bylo neúspěšně (např. proto, že uživatel neznal správný tvar příjmení hledané osoby, neznal správný tvar hledaného výrazu tak, jak se psal před padesáti lety atd.).
Nedávno byli všichni poslanci z jmenných rejstříků [15] od roku 1918 převedeni do databáze, která umožňuje zjistit, od kdy do kdy a v kterých volebních obdobích byla daná osoba poslancem a jaké funkce v zákonodárném sboru zastávala. Zatím ještě není tato databáze propojena s těsnopiseckými zprávami a není ani plně začleněna do Digitální knihovny. Dostanete se k ní přes stránku "Poslanci [16]" a dále volbou "Časové období".
Těsnopisecké zprávy posledních tří volebních období jsou provázány s relační databází poslanců, takže je hypertextově propojeno konkrétní místo v těsnopisecké zprávě, tj. místo, kde poslanec mluví, s jeho osobní stránkou, a obráceně - na stránce každého polance je odkaz na všechna místa v těsnopiseckých zprávách.
Jak vidíme budoucnost
Do budoucna nás čeká ještě spousta práce. Především je nutné dokončit digitalizaci chybějících parlamentních dokumentů, konkrétně se jedná o tisky z období 1929-1938 a 1948-1990.
Dále se již delší dobu řeší rozšíření možností vyhledávání v dokumentech Poslanecké sněmovny. V současnosti probíhá testování poloautomatické věcné indexace sněmovních tisků pomocí tezauru Eurovoc, který bychom chtěli využít jako další vyhledávací nástroj v sněmovních tiscích. Experiment však ještě není u konce a nějakou dobu bude trvat, než budou vidět jeho konkrétní výsledky v reálu, tzn. také v Digitální knihovně.
Odbor informatiky nyní testuje prohlížení sněmovních tisků minulého volebního období pomocí věcného rejstříku vytvořeného archívem. Konkrétní výsledky by mohly být patrné již v příštím roce.
Co je však nejpodstatnější a zřejmé ze všeho předešlého - Digitální knihovna již přerostla své původní rozměry. Není jen archivem historických dokumentů, ale v každé hodině se mění přílivem aktuálních materiálů a odkazů a stává se branou k informacím produkovaným Poslaneckou sněmovnou. S tím však bohužel zároveň přicházejí i problémy, z nichž jako nejpalčivější vidíme nutnost změny uživatelského rozhraní související se změnou koncepce celého webu Poslanecké sněmovny. Jak máte jistě každý svou zkušenost, sebelepší novinky a vylepšení nemají cenu, pokud je nikdo nenajde.