Databáze oborové terminologie zpřístupněna
Úvod
31.1.2003 byla na adrese http://www.nkp.cz/o_knihovnach/slovnik/index.htm [4] zpřístupněna Česká terminologická databáze knihovnictví a informační vědy (TDKIV). TDKIV je výsledkem projektu realizovaného v letech 2001-2002 [5] Odborem knihovnictví Národní knihovny ČR za grantové podpory Ministerstva kultury ČR (projekt č. KZ01P02OUK008) a spolupráce s řadou externích odborníků [6].
Tento článek přináší základní informace o TDKIV, možnostech jejího využití, průběhu řešení projektu a záměrech dalšího rozvoje. Podrobnější odborná studie o metodických a teoretických aspektech řešení projektu bude zveřejněna v č. 1/2003 časopisu Národní knihovna.
Základní informace
TDKIV je primárně výkladovou databází, která obsahuje 2800 hesel a cca 4200 termínů. Protože každé heslo obsahuje i anglický ekvivalent (celkem je v databázi obsaženo 3330 anglických termínů), je možné TDKIV používat i jako databázi překladovou. V této souvislosti je třeba zmínit již dříve zpřístupněnou databázi obsahující Anglicko-český a česko-anglický slovník knihovnické terminologie [7]; při tvorbě TDKIV byl částečně tento slovník využit, nicméně rozsah i kvalita termínů byla podstatně přepracována a obě databáze se proto překrývají pouze částečně. O jejich integraci se uvažuje do budoucna.
TDKIV pokrývá relevantní terminologii z oblasti knihovnictví a informační vědy a hraničních oborů, zastoupení jednotlivých tematických oblastí v databázi je patrné z následující tabulky:
Tab. č. 1 Tematická struktura TDKIVTematická oblast | Počet hesel | Podíl hesel [%] |
knihověda | 453 | 16,2 |
katalogizace, typologie katalogů | 287 | 10,3 |
internet, elektronické dokumenty, metadata | 285 | 10,2 |
doplňování, budování a ochrana fondu | 233 | 8,3 |
knihtisk, nakladatelská činnost | 224 | 8,0 |
typologie tištěných dokumentů | 223 | 8,0 |
věcné zpracování dokumentů, selekční jazyky | 208 | 7,4 |
informační věda a hraniční obory | 185 | 6,6 |
ediční činnost | 144 | 5,1 |
informační služby | 131 | 4,7 |
organizace a typologie knihoven | 90 | 3,2 |
databázové systémy, typologie databází, AIKS | 88 | 3,1 |
informační technologie | 84 | 3,0 |
bibliografie | 56 | 2,0 |
autorské právo | 41 | 1,5 |
bibliopedagogika | 40 | 1,4 |
informační vzdělávání a profese | 29 | 1,0 |
CELKEM | 2801 | 100,00 |
Jak vyplývá z tabulky, největší zastoupení v TDKIV má knihověda, pokud ovšem jednotlivé tematické oblasti sloučíme do větších celků podle disciplín, dostáváme odlišný obrázek o tematické struktuře TDKIV, který lépe odpovídá jejímu účelu a vymezení:
- knihovnictví (zpracování dokumentů, fondy, knihovny, tištěné dokumenty, služby, bibliografie): cca 44%
- související a hraniční obory (knihověda, knihtisk, nakladatelská činnost, bibliopedagogika, autorské právo): cca 27%
- automatizované zpracování informací (informační technologie, internet, elektronické dokumenty, metadata, ediční činnost, databáze, AIKS): cca 21%
- informační věda (informační věda, informační vzdělávání a profese): cca 8%
Vymezení i obsah databáze se budou v rámci rutinní správy průběžně měnit, aby co nejlépe odpovídaly aktuálnímu stavu oboru a terminologickým potřebám odborné veřejnosti (podrobněji viz kap. Správa a rozvoj databáze).
Heslo TDKIV se skládá z těchto polí:
Tab. č. 2 Struktura záznamu TDKIVOznačení pole | Pole | Povinnost pole | Opakovatelnost pole | Zobrazení uživateli |
ID | Identifikační číslo záznamu | ano | ne | ne |
TER | Termín | ano | ne | ano |
POZ | Poznámka | ne | ne | ano |
EKV | Ekvivalent | ne | ano | ano |
IND | Indikace ekvivalentu | ano | ne | ne |
POE | Poznámka k ekvivalentu | ne | ne | ano |
ANG | Anglický ekvivalent | ano | ano | ano |
VYK | Výklad | ano | ne | ano |
ZDR | Zdroj výkladu | ano | ano | ano |
PTE | Příbuzný termín | ne | ano | ano |
VS1 | Věcná skupina | ano | ne | ne |
SPC | Specifikace | ano | ne | ne |
STS | Status | ano | ne | ne |
AUT | Autor hesla | ano | ano | ano |
LEK | Lektor hesla | ano | ano | ano |
Pole EKV (Ekvivalent) obsahuje synonyma, antonyma či zkratky termínu obsaženého v poli TER. Charakter termínů v poli TER a EKV může být specifikován těmito konvenčními zkratkami uvedenými v poli poznámek (POZ nebo POE):
ant. – antonymumciz. – termín pocházející z cizího jazyka, který nemá vhodný český ekvivalent
hist. – termín označující historické předměty a jevy
neol. – neologismus, nový, neustálený termín
nespr. – nesprávný termín
nevh. – nevhodný termín
zast. – zastaralý termín
zkr. – označuje zkratku, která je obvykle rozepsána v závorkách
zř. – termín užívaný zřídka
Zdroj výkladu (pole ZDR) obsahuje zkrácenou citaci ve formě Autor-Rok:Strana, úplná citace je dostupná prostřednictvím HTML odkazu na seznam použitým zdrojů nebo přímo na záznam dokumentu obsažený v některé z databází NKČR.
Řešení projektu a tvorba databáze
V průběhu řešení projektu byla publikována řada informací (viz [1], [2] a [3]), základní postup řešení je také dokumentován na archivní www stránce projektu [5], v následujícím textu proto pouze shrneme nejdůležitější momenty tvorby TDKIV a některé její problematické aspekty.
Na řešení projektu se podílelo několik desítek odborníků; organizační a odborné řízení práce probíhalo prostřednictvím Redakční rady TDKIV (RR TDKIV) složené z řešitele a spoluřešitelky projektu (M. Ressler a J. Burgetová), interních konzultantů (V. Richter a J. Pilař) a externích konzultantů (J. Cejpek a J. Schwarz). V různých fázích práce bylo do projektu zapojeno 23 autorů, kteří prováděli výběr a zpracování hesel, 21 lektorů, kteří odpovídali za revizi hesel a 3 supervizoři, kteří analyzovali výsledný stav databáze z hlediska obsahu i struktury. Jmenný seznam autorů a lektorů je dostupný ve www archivu projektu [6], supervizi databáze prováděli K. Čadilová, D. Katuščák a M. Svoboda, revizí anglických ekvivalentů se zabývali D. a A. Mertovi. Pro efektivní komunikaci mezi spolupracovníky projektu byla zřízena elektronická konference Terminologie, která je nyní přístupná všem zájemcům o problematiku oborové terminologie (podrobnější informace v kap. Správa a rozvoj databáze).
Většina odborných činností prováděných při řešení projektu (výběr termínů, zpracování hesel, revize hesel a další) probíhala na základě podrobných metodických materiálů, které určovaly základní postup a organizaci práce; výběr nejdůležitějších pracovních podkladů je dostupný ve www archivu projektu [5].
Výchozím základem tvorby TDKIV bylo vymezení jejího obsahu a rozdělení na tematické oblasti (třídy). Tyto činnosti jsou úzce vázány na teoretické vymezení oboru knihovnictví a informační věda a jeho struktury, jejich ideální realizace je proto velmi obtížná a v podstatě představuje samostatný úkol přesahující samotnou terminologickou práci. V rámci projektu bylo proto zvoleno spíše pragmatické řešení vycházející z klasifikace používané v katalogu knihovnické literatury (KKL) vytvářeném Odborem knihovnictví NKČR. Přestože byla klasifikace v průběhu práce několikrát optimalizována, vymezení obsahu a struktury (třídění) databáze se nepodařilo uspokojivě v rámci projektu dořešit a zůstává otevřenou otázkou pro další rozvoj TDKIV. Na jejím řešení správce databáze, Národní knihovna ČR, musí nezbytně spolupracovat s institucemi, které mají zkoumání teoretických otázek oboru a jeho vymezení v „popisu práce“, tj. především s akademickými vzdělávacími institucemi (např. Ústav informačních studií a knihovnictví a další univerzitní pracoviště studijního oboru informační studia a knihovnictví).
Jakmile byl vymezen obsah a struktura TDKIV, došlo k výběru termínů potenciálně vhodných pro zařazení do databáze. Práce, na jejíž realizaci se podíleli již i autoři, byla rozdělena do tří fází:
- výchozí excerpční základnou byl Vícejazyčný slovník knihovnictví, resp. jeho anglicko-česká část, dostupná v Odboru knihovnictví NKČR v datové struktuře vhodné pro další zpracování; tento zdroj byl optimalizován (vyřazení nerelevantních termínů z hlediska TDKIV) a doplněn termíny z některých dalších zdrojů
- výsledný materiál byl rozdělen do tematických tříd a předán jednotlivým autorům k doplnění a úpravám
- po obdržení vybraných termínů od autorů byla posouzena jejich relevance z hlediska TDKIV a odstraněny duplicity, které při výběru vznikly
Fáze výběru termínů byla problematická zejména z těchto důvodů:
- přestože byly v samostatném metodickém materiálu formulovány zásady pro výběr termínů do databáze, v řadě případů bylo obtížné určit, zda termín do databáze skutečně patří či zda lze daný výraz chápat jako termín
- při zapojení 23 autorů, jimž byly pro výběr termínů rozděleny jednotlivé tematické oblasti, došlo k relativně vysoké míře duplicit mezi třídami, které musely být před předáním termínů ke zpracování hesel odstraněny
Souběžně s výběrem termínů probíhala definice struktury záznamu TDKIV (výsledná podoba viz výše), která se stala základem pro další fázi projektu, zpracování hesel.
Při zpracování hesel byly termíny opět podle jednotlivých tříd rozděleny autorům, kteří ke každému termínu vytvořili heslo podle požadované struktury, pravidel a postupu specifikovaném v metodice zpracování hesel TDKIV.
Největším problémem této fáze byla různorodost rozsahu a kvality zpracování hesla, zejména u polí anglický ekvivalent, výklad a zdroj výkladu. Kvalita anglických ekvivalentů byla různá podle jazykových znalostí jednotlivých autorů. Přestože anglické ekvivalenty procházely dalšími třemi úpravami (revize hesel, revize anglických ekvivalentů a redakční úpravy hesel), mnohé z nich nejsou zcela uspokojivé ani ve výsledné verzi databáze. Některá hesla také měla nadměrně rozsáhlý, encyklopedický výklad, nebo výklad naopak nedostatečně vysvětloval význam termínu. Obdobně i u zdrojů výkladů byly někdy použity z hlediska kvality (interní materiály, dílčí webové stránky apod.) nebo aktuálnosti (zastaralé prameny) neadekvátní zdroje.
Účelem revize hesel, kterou prováděli lektoři, bylo uvedené a další nedostatky zpracování hesel odstranit. Zde se v řadě případů ukázala např. rozdílná koncepční východiska některých autorů a lektorů, která ovlivňovala i kvalitu výkladu a musela být vyřešena později v rámci redakčních úprav hesel. Samostatnou částí byla revize anglických ekvivalentů, která probíhala souběžně s celkovou revizí hesel.
Po zpracování a revizi hesel byly provedeny nezbytné redakční úpravy. Spočívaly zejména v zapracování připomínek a úprav lektorů a alespoň v přibližném sjednocení rozsahu a kvality jednotlivých hesel, zejména jejich výkladů. Následně byla celá pracovní verze databáze zpřístupněna autorům i lektorům, aby mohli připomínkovat výsledný stav hesel, která zpracovávali, a zejména supervizorům, jejichž úkolem bylo vypracovat celkové hodnocení obsahu i struktury TDKIV. Výsledkem supervize byly posudky, které obsahovaly řadu cenných podnětů pro další rozvoj TDKIV i konkrétní připomínky k dílčím položkám databáze.
Po zapracování dílčích připomínek autorů a lektorů a některých připomínek supervizorů byla databáze TDKIV zpřístupněna [4] na www stránkách Národní knihovny ČR.
Správa a rozvoj TDKIV
TDKIV od 1.2.2003 přešla z projektové fáze do rutinního provozu, který zajišťuje Odbor knihovnictví NKČR. Databáze zůstane otevřeným, průběžně aktualizovaným informačním zdrojem, jehož datová základna bude neustále rozšiřována a optimalizována. Součástí správy bude především:
- optimalizace současného stavu hesel, který v některých případech není z různých důvodů zcela ideální (viz příklady různých problémů zpracování hesla uvedené výše)
- doplňování a zpracování nových hesel, která v databázi chybí a jsou z hlediska vymezení TDKIV relevantní
Propracováno, popř. částečně redefinováno by mělo být i vymezení databáze a použitá klasifikace, bez níž nelze databázi efektivně spravovat a rozšiřovat.
V dlouhodobějším výhledu se počítá s rozšířením struktury databáze, s integrací dílčích databází (např. db zkratek) a dynamickou vazbou na externí zdroje tak, aby se TDKIV blížila široce využitelné terminologické znalostní databázi.
Rozvoj TDKIV není možný bez spolupráce s dalšími institucemi a jednotlivci, NKČR proto bude průběžně navazovat kontakty především s akademickými a odbornými pracovišti, které budou mít zájem podílet se na správě, rozvoji a využití TDKIV. Nejaktivnější institucionální či individuální spolupracovníci TDKIV budou přizváni do Expertní rady TDKIV, jejímž úkolem bude koncepční a metodické řízení dalšího rozvoje TDKIV.
Pro individuální zájemce o problematiku oborové terminologie a terminografie (tvorby a popisu terminologie) je zřízena na adrese terminologie@cvut.cz [8] veřejná konference Terminologie. Zájemci se mohou do konference přihlásit zasláním textu „subscribe terminologie“ v těle e-mailu na adresu majordom@zikova.cvut.cz //--> [9]'; // --> .
Závěr
V průběhu dvouletého projektu a za přispění více než 50 spolupracovníků bylo vytvořeno terminologické dílo, které nemá v historii českého knihovnictví a informační vědy obdoby. Přesto je současný stav pouze základem pro další rozvoj nejen databáze samotné, ale i české oborové terminologie. Doufáme proto, že k rozvoji TDKIV přispějete i Vy svými připomínkami a názory zasílanými do výše uvedené konference nebo na níže uvedenou kontaktní adresu.
Kontaktní adresa
Mgr. Eva BartůňkováNárodní knihovna ČR
Odbor knihovnictví
Klementinum 190
110 01 Praha 1
tel:. 221 663 342
e-mail: Eva.Bartunkova@nkp.cz [10]
[1] Ressler, Miroslav. Česká výkladová terminologická databáze z oblasti knihovnictví a informační vědy : informace o projektu a nabídka spolupráce . Ikaros [online]. 2001, č. 10 [cit. 2001-10-01]. Dostupný z WWW: http://www.ikaros.cz/Clanek.asp?ID=200208385 [11].
[2] Ressler, Miroslav. Česká výkladová terminologická databáze z oblasti knihovnictví a informační vědy : dosavadní průběh a výsledky řešení projektu. Čtenář, 2002, roč. 54, č. 10, s. 280-281.
[3] Burgetová, Jarmila. Projekt České terminologické databáze z oblasti knihovnictví a informační vědy. Bulletin SKIP, 2002, č. 4. Dostupný z WWW: http://www.nkp.cz/o_knihovnach/konsorcia/skip/Bull02_423.htm [12]