Konference ETD 2003
Šestý ročník konference ETD 2003 [4] se letos konal 21.-24.5. poprvé mimo území USA, a to v Berlíně na Humboldtově univerzitě. Konference je pořádána každoročně pod záštitou iniciativy Networked Digital Library of Theses and Dissertations [5] (NDLTD).
Ve svém příspěvku budu používat pro označení kvalifikačních prací zkratku ETD (Electronic Thesis & Dissertations) s ohledem na rozdíly terminologie i situace ohledně vysokoškolských prací, které mají být náplní projektů archivace a zpřístupňování, u nás a v zahraničí
Původně severoamerická iniciativa NDLTD, založená roku 1997 z popudu profesora Edwarda Foxe z Technické univerzity ve Virginii, je v současnosti federací již 149 členů z řad vysokých škol a podporujících organizací. Aktivity NDLTD se zaměřují na vysoké školy, knihovny, fakulty a postgraduální studenty s cílem podporovat celosvětově tvorbu, indexování, archivaci, rozšiřování a vyhledávání ETD.
NDLTD se snaží podporovat vzdělávání a výuku, zejména umožnit studentům prezentovat své práce v elektronické formě, používat digitální knihovny a pochopit problémy publikování.
Dlouhodobou vizí NDLTD je nárůst dosažitelnosti studentských odborných prací a jejich uchování v elektronické formě. Zároveň se snaží přesvědčit studenty, aby při publikování svých prací využívali multimediální technologie a hypermédia.
NDLTD se snaží vést univerzity ke zpřístupňování svých informačních zdrojů, k rozšiřování technologie digitálních knihoven, ke sdílení zkušeností, technologií a znalostí.
Náplní letošního ročníku konference bylo celosvětové zpřístupňování ETD. Jednání bylo rozděleno na panelové a paralelní sekce, které byly tematicky zaměřeny na prezentaci národních a speciálních projektů a na technologická řešení a pracovní postupy. Nebylo samozřejmě možné se zúčastnit všech paralelních sekcí, proto ve svém příspěvku budu informovat o prezentacích projektů, které jsem vyslechla a které pokládám za nejzajímavější z hlediska technologického řešení nebo geografické lokace.
Konferenci zahajoval profesor Edward Fox, výkonný ředitel NDLTD, který shrnul šestileté působení federace a zdůraznil její otevřenost pro nové řádné i přidružené členy. Axel Plathe, zástupce UNESCO [6], informoval mj. o podpoře pilotních projektů ETD v Africe, Evropě a Latinské Americe.
Joan K. Lippincottová, Coalition for Networked Information [7], USA, v úvodní prezentaci zdůraznila význam spolupráce mezi institucemi i v mezinárodním měřítku, nutnost výměny zkušeností, zaměřených zejména na způsoby uchovávání elektronických dokumentů, metadata a jejich harvesting, institucionální úložiště elektronických dokumentů a získávání zdrojů. Při projektech ETD je nezbytná spolupráce studentů jakožto tvůrců ETD, vysokých škol a jejich administrativních zaměstnanců, pracovníků ICT a knihovníků.
Martin Sévigny z AJLSM představil projekt CyberThéses, ze kterého vzešla stejnojmenná platforma pro archivaci a zpřístupňování ETD, založená na využití strukturovaného textu (původně SGML, nyní XML), která umožňuje tvorbu XML dokumentů z tradičních textových editorů, jejich indexování a rozšiřování. Celý soubor nástrojů je volně dostupný (GPL licence) na stránce projektu CyberThéses [8].
Další blok přednášek, který jsem navštívila, byl zaměřený na národní ETD iniciativy, konkrétně na projekty ze Španělska, Jihoafrické republiky a Ruska.
Projekt Digitální knihovny nesoucí jméno Miguela de Cervantese [9], byl zahájen v roce 1999. Část zaměřená na ETD [10] archivuje a zpřístupňuje práce psané ve španělštině a práce věnované španělské kultuře, vznikající po celém světě. V digitální knihovně je v současnosti na 300 ETD ze 30 zemí světa. Všechny práce jsou pečlivě zkatalogizovány a zatříděny podle MDT a předmětové klasifikace UNESCO. Dokumenty jsou uchovávány ve formátu PDF.
Situace ve vzdělávání v Jihoafrické republice je velice problematická na tzv. "historicky znevýhodněných institucích" vzhledem k nestabilní měně, nízkému rozpočtu, nedostatečnému stupni rozšíření telekomunikační infrastruktury a počítačové gramotnosti. Přesto i na těchto institucích bylo uskutečněno nebo stále probíhá několik lokálních projektů ETD na platformě akademických vysokoškolských konzorcií (GAELIC [11], CALICO [12], SEALS, FRELICO [13], ESAL), což umožnilo např. zapojení do mezinárodních aktivit NDLTD. Příspěvek Chrise Rensleigha popisuje pilotní projekt ETD na Rand Afrikaans University [14]. Na RAU je v současnosti 400 ETD.
V Rusku vzniká od léta 2002 digitální knihovna ETD jako součást Ruské digitální knihovny OREL [15]. OREL obsahuje 138 ETD včetně obsahů, bibliografických záznamů a autoritních záznamů autorů ETD. Práce jsou klasifikovány znaky KBT. Práce jsou vystavovány ve formátu PDF, nicméně do budoucna se uvažuje o ukládání prací v XML. Zatím OREL obsahuje celkem 30 ETD v XML.
Druhý den jednání zahajovala opět panelová sekce. Ana Pavani z PUC [16] z Brazílie informovala o systému kurzů a školení v rozvojových zemích, podporovaném UNESCO. Díky kurzům získali pracovníci dovednosti a schopnosti, bez nichž by nebylo možné zahájit projekty ETD.
Další příspěvek byl věnován africkému projektu DATAD (Database of African Theses and Dissertations) [17]. Největší část kvalifikačních prací je vytvářena v JAR (souborný katalog vysokoškolských prací budovaný od roku 1918 UCTD [18]) a v Egyptě (Ain Shams University Network ASUNET). Je nanejvýš důležité zapojení ostatních afrických zemí, protože dostupnost výsledků vědeckého poznání je velice nízká.
Ve Velké Británii zájem o ETD vzrostl v polovině 90. let. V té době také vznikla pracovní skupina UTOG (University Theses Online Group). Mezi nejdůležitejší britské projekty patří:
Daedalus [19] (projekt University Glasgow), e-prints UK [20], Electronic Theses [21] (projekt konsorcia vedeného Robert Gordon University) , HaIRST [22] (Harvesting Institutional Resources in Scotland Testbed - projekt University v Strathclyde, SHERPA [23], TARDIS [24] - projekt University v Southamptonu, Theses Alive! University v Edinburgh [25].
Příspěvek Gail McMillan, Digital Library and Archives [26], se týkal problematiky dlouhodobého uchování a nepřetržitého zpřístupnění ETD, např. pomocí metod zrcadlení.
Další tématická sekce, které jsem se zúčastnila, byla věnována dlouhodobému uchovávání ETD.
Hans Liegmann z Německé národní knihovny (DDB) [27] popsal systém uchovávání kvalifikačních prací v DDB. ETD jsou archivovány od roku 1998, DDB uchovává na 16 000 ETD. Metadata ve standardizovaném formátu jsou do DDB dodávána institucí, na které byla práce obhájena. Elektronická forma práce se nachází na archivním serveru [28]. ETD jsou dokonce pokládány jako výborný začátek ochranné archivace dokumentů v elektronické podobě vůbec, protože je to z jistého pohledu snazší (jsou to monografie, které se nevyskytují ve více verzích, jsou to statické dokumenty, v jednoduchém formátu).
Peter Hansson představil projekt DiVA Univerzity v Uppsale [29], v rámci kterého jsou ETD uchovávány v XML jako formátu pro dlouhodobé uchování. V rámci projektu byly srovnávány dva formáty – DocBook [30] a TEI [31], přičemž byl jako základ vybrán DocBook. Byl definován dokumentový formát DiVA, založený na XML, verze 1.0 obsahuje 99 elementů pro metadata [32], používá kódování UTF-8. Elementy jsou pojmenovány v angličtině. (Celý text příspěvku [33])
Yahia Bakelli z alžírského CERIST [34] seznámil účastníky s dalším africkým projektem. Každá vysokoškolská kvalifikační práce obhájená v Alžírsku musí být odevzdána v CERIST, což je podmínka pro získání diplomu. V elektronické podobě bylo dosud odevzdáno 1463 prací, 86% v arabštině a 14% ve francouzštině. Práce byly dodávány na disketách (87%) a na CD-ROM (13%). Tato média však nejsou pro uchování ideální (5% disket a 32% CD-ROM bylo nečitelných). Proto jsou ETD ukládány ve formátu PDF na pevné disky v CERIST. Pro dlouhodobé uchování se jako nejvýhodnější jeví XML standard. Využívají zde platformy CyberThéses.
Kelsey Libner, z knihovny Státní univerzity Severní Karolíny [35] hovořil o průzkumu 16 vysokoškolských knihoven v Severní Karolíně, který byl zaměřen na současný způsob uchování ETD s cílem dlouhodobé archivace. Politika získávání ETD je různá: 11 institucí požaduje od studentů práci povinně, v 5 institucích jsou odevzdávány dobrovolně. 9 institucí požaduje práce v PDF, 7 akceptuje PDF nebo jiný formát (HTML). Plány pro přechod k formátu pro dlouhodobé uchování předpokládá náklady 10 dolarů na 1 práci. Prozatím nebyl vybrán vlastní formát pro archivaci, příspěvek porovnával PDF, TIFF a textové editory, ale rozhodně se počítá s archivačními metadaty (METS včetně OAI modelu).
V sekci speciálních aplikací se první příspěvek Scotta Eldredge z Brigham Young University [36] týkal retrospektivní konverze vysokoškolských prací. Tento proces je náročný, musí být proveden výběr prací, které je žádoucí převést do elektronické podoby, zda využít vlastních sil nebo dodavatelsky, je nutné vybrat vhodné formáty a standardy. Komplikovaná je také otázka autorských práv.
Další prezentace představila projekt Texas A&M University [37], která převedení postgraduální prací do elektronické podoby využila služeb UMI. Absolventi této univerzity dodávali své práce do systému firmy UMI (10381 dizertací z let 1963-1996), která je uchovávala na mikrofilmech. Digitalizace začala v listopadu 2002, na jaře 2003 byla kompletní. Práce od roku 1996 jsou součástí systému NDLTD. Sbírka ETD [38] je umístěna na serveru univerzity. Práce jsou ve formátu PDF.
Stephan Ullrich z Technické univerzity v Chemnitz [39] představil prototyp knižního skeneru vyvíjeného na této univerzitě. Skener dokáže sám obracet listy knihy v rozsahu velikosti 10x15 cm a 30x45 cm. Chybovost tohoto způsobu je 4 chyby na 1000 stran. Skener se nedokáže vypořádat s příliš tenkými listy knihy, slepenými stránkami a samostatnými listy. Uvažuje se o skeneru, který by dokázal vyměňovat knihy bez zásahu služby, nicméně již aktuální prototyp výrazně šetří lidskou práci a tedy i vynaložené náklady.
Thomas B. Hickey z OCLC informoval o souborném katalogu NDLTD [40]. OCLC sbírá záznamy prostřednictvím OAI-PMH, buduje souborný katalog na platformě VTLS, který obsahuje více než 60 000 záznamů. Souborný katalog NDLTD je přístupný volně [41].
Ve čtvrtek na závěr jednacího dne proběhla hodinová panelová diskuse, která se týkala příručky UNESCO k ETD [42]. UNESCO pokládá ETD za velice důležitý informační zdroj a poskytuje rozsáhlou podporu zemím, které se do těchto aktivit chtějí zapojit. Řešila se zde otázka autorských práv, kdy se lišila situace jednotlivých účastnických zemí.
Poslední den jednání byl zahájen příspěvkem Petera Schirmbachera, předsedy programové komise letošní konference, ve kterém shrnul kulturu elektronického publikování. Vědecké publikování má dlouhou tradici, nicméně vstupem elektronických médií se zažité způsoby publikování začínají měnit a je nutné stanovit pro novou kulturu nová společná pravidla. Představil iniciativu DINI [43] (Deutsche Iniciative für NetzwerkInformation), která vydala doporučení Elektronisches Publizieren an Hochschulen - Empfehlungen [44], jak utvářet rozhraní pro OAI.
Shalini Urs z University of Mysore představila indický projekt Vidyanidhi [45], který byl jako pilotní projekt zahájen v roce 2000 a měl za úkol zjistit proveditelnost ETD v Indii. Databáze obsahuje 40 000 bibliografických záznamů indických vysokoškolských kvalifikačních prací včetně metadat a 200 ETD. V rámci projektu proběhla série školení pro postgraduální studenty, aby se naučili své práce připravovat v elektronické formě. Situace v Indii je složitější i vzhledem k různorodosti jazyků i písem (18 oficiálních jazyků).
Andrew Wells z University of New South Wales [46], Austrálie, pozval účastníky na konferenci ETD 2005, která se bude konat na půdě této univerzity. Dále představil Australian Digital Thesis Program [47] (ADT). Projekt sedmi australských univerzit byl zahájen v roce 1997, od počátku probíhala úzká spolupráce s Technickou univerzitou ve Virginii. Pro EDT je používán software NDLTD. Tato iniciativa vedla k založení Council of Australian University Librarians [48] (CAUL), která má 38 členů. Každý člen je automaticky členem ADT. Aktivity ADT se neomezují pouze na Austrálii, ale byla navázána spolupráce s novozélandskými univerzitami.
Příští konference ETD 2004 se bude konat opět v USA, a to na Univerzitě v Kentucky.
Problematika elektronických vysokoškolských kvalifikačních prací, jejich archivace a zpřístupňování je v současné době diskutovaných tématem i na domácí knihovnické scéně, o čemž svědčí diskuse v Klubu vysokoškolských knihovníků SKIPu [49] či zařazení několika podstatných příspěvků na letošní konferenci Inforum, v sekci Přechod od klasických k elektronickým médiím [50]. Situaci ve vyspělých zemích také systematicky zmapovala Eva Bratková (viz příspěvek [51] na Inforu nebo článek v NK, č. 4/2002 [52]).