Retrodigitalizace diplomových a bakalářských prací v SVI ESF MU aneb od papíru k elektronickým obrazům
V roce 2002 se na Ekonomicko-správní fakultě MU rozběhl projekt odevzdávání a zpřístupňování bakalářských a diplomových prací v elektronické podobě. Tento systém a jeho fungování již byly popsány v článku dříve zveřejněném v časopise Ikaros [4], zde bychom rádi ve zkratce přiblížili jeho druhou, logickou fázi. Jedná se o retrodigitalizaci závěrečných studentských prací, které vznikly před rokem 2002, což představuje zhruba 1 800 prací o rozsahu zhruba 115 000 stran formátu A4. K realizaci tohoto projektu nás vedla řada dobrých důvodů.
Patří mezi ně zejména
- existence duálního systému (vše v "papírové podobě" a jen část z prací i v elektronické podobě, tedy "něco je tady a něco je zas tam") neposkytovala uživatelům našich služeb potřebný komfort: rychlou a elegantní dosažitelnost všech závěrečných prací v elektronické podobě z celé budovy a (v budoucnosti) odkudkoliv po internetu prostřednictvím autorizace;
- závěrečné práce, kterých je v současné době v papírové podobě celkově více než 3 000 exemplářů, zabírají v knihovně stále více nedostatkového prostoru;
- jako přitažlivá se jeví i budoucí možnost provázat knihovní katalog ALEPH přímo s těmito elektronickými dokumenty;
- eliminace nutnosti manipulovat s papírovými pracemi (řazení, rovnání, vracení apod.) dává příslib šetřit lidskou práci;
- vyčlenění papírových forem mimo fond a užívání jen elektronických forem brání nenahraditelnému zcizování, poškozování anebo opotřebovávání klasických forem a v neposlední řadě pak lákala i
- možnost jednoduchým způsobem řídit, event. i měnit režimy přístupu k těmto pracím pro různé skupiny uživatelů (pedagogičtí pracovníci, studenti, doktorandi a externí čtenáři).
Proto jsme počátkem letošního roku zpracovali návrh interního fakultního projektu retrodigitalizace závěrečných prací a k jeho realizaci posléze získali i finanční zdroje a organizační podporu. Objem potřebných prostředků představoval zhruba 200 000 Kč, které jsou hrazeny z fakultních zdrojů vyčleněných pro tzv. nespecifikovaný výzkum. Do této oblasti spadají společné projekty prováděné akademickými pracovníky, doktorandy a studenty k rozvoji informatického a technického zabezpečení studentské vědy a výzkumu. Větší část plánovaných nákladů představují mzdové náklady (skenování, zabezpečení dokumentů, provázání primárních dokumentů s metadaty) a náklady na služby (řezání papírových verzí prací, doprava, skladování a manipulace s materiálem), zbytek pak nákupy technických zařízení (rychlý skener s podavačem, zálohovací zařízení, drobný materiál apod.). Na projektu se v různých rolích podílí necelá desítka osob. Uskutečnění našich záměrů jsme rozplánovali přibližně do deseti měsíců letošního roku (březen - prosinec) a práce rozdělili do dvou hlavních, simultánně probíhajících akcí.
V první z nich - abychom ušetřili zbytečnou práci - jsme hromadným dopisem požádali všechny naše absolventy z let 1995-2001 o zaslání závěrečné práce v elektronické podobě buď e-mailem nebo ve formě diskety nebo CD poštou; během měsíce se nám tímto způsobem podařilo shromáždit zhruba 230 elektronických prací. U této formy je výhodou zejména zachování možnosti fulltextového vyhledávání ve výsledných dokumentech, zatímco práce skenované klasicky takovou možnost již přímo nedávají.
K vlastní digitalizaci pomocí skeneru pak zbývalo 1 570 prací. I zde bylo možné jít dvěma cestami. Na naší fakultě odevzdávají posluchači závěrečné práce ve dvou exemplářích. Jeden z nich se ukládá do knihovny (SVI) a druhý zůstává na katedrách buď u školitelů nebo v nějakém více či méně provizorním skladu. Jednotlivé katedry jsme oslovili jednoduchou nabídkou: "vydejte nám závěrečné práce v papírové podobě, odměnou vám bude nejen získaný prostor, ale zejména neomezený přístup ke všem závěrečným pracím v elektronické podobě v místní počítačové síti z let 1995-2004 v horizontu méně než deseti měsíců". To byla nabídka, které prostě nebylo možné odolat; díky tomu se nám podařilo shromáždit více než 1 000 prací. Protože se jednalo o duplikáty, které jsme již měli v SVI "tak jak tak" uloženy, mohli jsme postupovat značně netradičně a brutálně: dokumenty jsme odvezli do vydavatelství MU na Kraví hoře, kde jsme je zevrubně seznámili s ostrostí nože tamní strojové řezačky papíru. Prostě a jednoduše jsme všechny práce nechali rozřezat tak, abychom z každé z nich získali jen volné listy vyňaté (vyřezané) z pevné vazby. To proto, že jsme k retrodigitalizaci pořídili skener s podavačem papíru a rozřezané práce tak nebylo třeba složitě a pracně skenovat obracením listů, ale celá práce se vložila do podavače a skener si již se vším poradil sám.
Konečně zbývala již jen poslední skupina dokumentů, tedy originály, od kterých již neexistovaly bez nenapravitelné škody "rozřezatelné duplikáty", zhruba 400 kusů. K jejich digitalizaci jsme využili existenci velkého knižního skeneru v jedné spřátelené instituci, na kterém jde práce od ruky přece jen o poznání rychleji než při práci na klasickém malém skeneru. Tato etapa v současnosti (tj. v září) probíhá a jsme již jen v očekávání, kdy v několika málo adresářích na našem diskovém serveru Diskobolos najde svůj trvalý domov zbytek z 1 800 *.pdf [1] souborů. Stane se tak nejpozději do konce tohoto roku a bude to náš nehmotný výsledek značně hmotného úsilí plného "násilí na knihách".
V té době se budeme snažit již také zpřístupnit plody práce našim uživatelům; zcela jisté je, že pro pedagogické pracovníky fakulty bude kompletní archiv více než 3 000 závěrečných prací přístupný v místní intranetové síti bez omezení. Co se týká přístupu studentů k archivu závěrečných prací, stále narážíme na nikoli úplně přesně srozumitelný rozsah a výklad pojmu užití těchto prací "k nevýdělečné vnitřní potřebě školy". Někteří právníci se domnívají, že diplomové a bakalářské práce v klasické papírové formě by měly být uloženy tak, aby je ani nebylo možné kopírovat na kopírovacích zařízeních. U elektronických forem by pak analogický režim zpřístupnění pravděpodobně představoval možnost si tyto práce jen "prohlížet na obrazovce" bez možnosti je tisknout, kopírovat jejich části nebo je celé ukládat na média (CD, diskety, síťové disky) nebo odesílat elektronickou poštou. Globálně vzato budeme u "nových" elektronických prací (vydaných v roce 2002 a později) - u kterých máme souhlas autorů k jejich publikování v síti internet [2] - postupně směřovat k jejich plně volné dostupnosti v rámci internetu. U starších a retrodigitalizovaných prací - bez takového souhlasu - se budeme řídit autorským zákonem a jeho relevantním výkladem. Jako perspektivní se jeví možnost propojení elektronického knihovního katalogu MU (ALEPH) se závěrečnými pracemi v elektronické podobě.
Domníváme se, že na konci našeho projektu, kdy budou klasické papírové dokumenty odsunuty do odlehlého, potemnělého skladu a nahrazeny jen elektronickými obrazy, budou rozličnými a nezanedbatelnými způsoby profitovat všichni zainteresovaní hráči.
1. Dokumenty jsou primárně uchovávány ve formátu PDF, každý je digitálně podepsán s uplatněním zabezpečovacích pravidel formátu PDF tak, že nepovoluje texty tisknout ani kopírovat jejich části. Nad daty pak funguje vlastní vyhledávací systém. Technická stránka našeho fungování našeho systému elektronických závěrečných prací je velmi instruktivně popsána zde: http://www.econ.muni.cz/svi/data/caslin2004-esf.doc [5]
2. Aktuální míra souhlasů studentů s publikováním závěrečných prací v síti internet se pohybuje kolem 80 procent (2002 = 79,8 %, 2003 = 82,9 %).