Metadatový standard ONIX a jeho implementace v Nakladatelství Karolinum
Na podzim roku 2018 se univerzitní nakladatelství Karolinum společně s několika studentkami Informačních studií a Knihovnictví při FF UK rozhodlo zjistit co možná nejvíc informací o implementaci metadatového formátu ONIX pro univerzitní nakladatele. Tento projekt si kladl za cíl zhodnotit, zda je tento metadatový formát vhodný pro použití v nakladatelství Karolinum, a zároveň skrze webové stránky a sociální média propojit ty české nakladatele, kteří o implementaci uvažují, či dokonce formát již používají. Následující text představuje jak výsledky průzkumu, tak standard samotný, a otevírá možné cesty pro budoucí rozšíření standardu v rámci České republiky.
Představení ONIXu
ONIX (Online Information Exchange) je všeobecně definován jako rodina mezinárodních norem určených k podpoře komunikace mezi počítačovými systémy partnerů, kteří se zabývají tvorbou, distribucí, licencováním nebo jiným zpřístupněním duševního vlastnictví v publikované podobě, ať již fyzické, nebo digitální. Zodpovědnost za vývoj a implementaci standardu nese mezinárodní skupina EDItEUR, americká BISG (The Book Industry Study Group) a britská BIC (Book Industry Communication). V současnosti existují tři ONIX standardy:
- ONIX for Books – standard nejstarší a nejvíce užívaný. Umožňuje vydavatelům knih a e-knih vytvářet a spravovat sbírku informačně bohatých metadat o jejich produktech a sdílet je se zákazníky (distributory, maloobchodníky apod.).
- ONIX for Serials – určený pro sdílení informací o seriálových publikacích, včetně např. informací o předplatném; mnoho polí přejímá z ONIX for Books.
- ONIX for Publications Licenses – standard určený pro správu licenčních podmínek pro digitální publikace.
ONIX for Books
S nástupem internetu a přesunem drtivé většiny informací o knižních produktech na web vznikla potřeba tyto informace rychle a efektivně sdílet. Zvýšil se také objem multimediálního obsahu. Požadavky na formát sdílených dat se zároveň mezi jednotlivými nakladateli a distributory lišily. ONIX for Books byl tedy vyvíjen jednak kvůli potřebě sdílení stále většího množství různorodého elektronického obsahu, jednak kvůli standardizaci komunikace mezi různými články dodavatelského řetězce. Cílem je efektivnější a rychlejší načítání aktuálních informací o produktech do interních nebo zákaznických systémů s menší potřebou ručního zásahu a mnohem nižším rizikem chyb. Standard ONIX for Books také snižuje náklady na podporu, neboť odpadá nutnost řešit různé proprietární datové formáty.
Jak to funguje?
Standard má definovaný seznam datových polí (sdružených do tzv. codelistů) a způsob, jakým tato data zasílat – v tzv. ONIX zprávě (ONIX message). Tato zpráva má podobu strukturovaného dokumentu v jazyce XML a sestává z položek definovaných pomocí jednotlivých XML značek (tagů), které jsou uspořádány (a také automaticky validovány) pomocí dokumentů ONIX DTD (Document Type Definition) či XSD (XML Schema Definition). Každý datový prvek má svou jasnou definici, aby byla zajištěna stejná interpretace na všech stranách. Samotný zápis standardu může obsahovat více než 200 různých položek, ale jen některé z nich jsou povinné.
Pro lepší orientaci vydává EDItEUR dokumenty, které popisují dobrou praxi, specifické návody nabízejí také jednotlivé národní skupiny. Využití či nevyužití jednotlivých prvků závisí na různých okolnostech (např. velikost nakladatele, typ publikace, typ adresované organizace [např. knihovna vs. distributor]). Cílem ONIXu je však poskytnout nástroje pro sdílení všech typů dat, včetně těch málo frekventovaných. Jedna ONIX zpráva může obsahovat libovolné množství dokumentů. ONIX 3.0 nabízí také možnost tzv. „block-level update“ záznamů: záznam je definován jako update a umožňuje pak vynechání jednotlivých ucelených bloků informací, což značí, že v nich nedošlo k žádným změnám. V případě aktualizací tak není potřeba zasílat celý záznam znovu. Stejně tak je možné odeslat prázdnou ONIX zprávu jako potvrzení, že k žádným změnám nedošlo.
Za dobu své existence prošel ONIX několika změnami. Aktuální verze ONIX 3.0 není zpětně kompatibilní s verzemi předchozími, což má za následek, že mnozí uživatelé stále setrvávají u ONIXu 2.0 nebo 2.1.
Příklad zápisu pro autora Prof. Steve Jones:
<Contributor>
<SequenceNumber>1</SequenceNumber>
<ContributorRole>A01</ContributorRole>
<PersonName>Prof. Steve Jones</PersonName>
<PersonNameInverted>Jones, Prof. Steve</PersonNameInverted>
<TitlesBeforeNames>Prof.</TitlesBeforeNames>
<NamesBeforeKey>Steve</NamesBeforeKey>
<KeyNames>Jones</KeyNames>
</Contributor>
ONIX je navržený tak, aby mohl být užit globálně a nebyl limitován jazykovými podmínkami. Nicméně jednoduchá uživatelské rozhraní může limitovat například při zápisu některých jmen.
Veškeré specifikace a dokumenty potřebné k jeho implementaci poskytuje výše uvedená společnost EDItEUR zdarma na svých webových stránkách, není třeba žádné registrace ani členství v organizaci. Tato společnost se stará o standard jako takový, ne však o jeho implementaci. Ta je plně v režii uživatelů a vydavatelů.
Z technického pohledu lze ONIX implementovat v různém rozsahu a různým způsobem. Naprosto základním a nejlevnějším řešením je pracné ruční vyplňování položek samotné metadatové zprávy v datovém souboru XML. Další úroveň může mít podobou jednoduchých exportních formulářů (založených na jakékoli technologii schopné exportu XML dat – PHP, Ruby, XQuery, Java atp.). Komplexní implementace pak může zahrnovat automatické generování metadat nakladatelskými CMS nebo třeba používání specializovaného editoru ONIXEDIT.
Situace v zahraničí
Na vývoji ONIXu 1.0 se podílela společnost EDItEUR a Americká asociace nakladatelů (AAP) ve spolupráci s BIC (UK) a BISG (US). Poprvé byl představen v roce 2000 v USA a Velké Británii, není proto překvapivé, že nejrozšířenější je stále v angloamerickém prostředí. Jako první zavedly ONIX zejména velké společnosti a asociace, které na rozdíl od menších institucí snáze našly prostředky pro jeho implementaci. Již data z roku 2004 uvádějí, že společnosti, které používají ke sdílení svých metadat ONIX, pokrývají více jak 50 % amerického knižního trhu; od té doby využití ONIXu stále roste. Napomáhá tomu také rozvoj softwarových nástrojů, které usnadňují práci s ONIXem i menším nakladatelům s omezenými prostředky.
Podle webu společnosti EDItEUR se za dobu existence ONIXu podílelo na jeho vývoji dalších patnáct zemí. Mnoho z nich založilo vlastní komise a národní skupiny, ve kterých řeší národní specifika standardu a vydávají vlastní dokumenty s příklady dobré praxe. EDItEUR také zveřejňuje seznam společností, které ONIX používají; tento seznam zdaleka není úplný, lze z něj však vyčíst, že primát stále drží organizace z USA a Velké Británie. Z evropských zemí je pak na vrcholku žebříčku Německo. Postupně se ONIX dostává také do jiných zemí, včetně asijských a jihoamerických. Do střední a východní Evropy zatím standard příliš nepronikl, malou výjimku tvoří Polsko a Rusko.
Pro české nakladatele může být zajímavé, že ONIX užívají velké nadnárodní společnosti, jako je Amazon či Google, a stejně tak i mnozí poskytovatelé akademických databází, jako např. EBSCO, Scopus, ProQuest či JSTOR.
Ačkoli má ONIX sloužit jako společný metadatový standard napříč odvětvími, jeho využití v rámci knihoven je zatím relativně malé. Vzhledem k tomu, že se jedná o standard cílený především na komunikaci o informačním obsahu jako o produktu, nejspíš se nedá očekávat, že by nahradil specifické knihovnické metadatové formáty (typicky MARC nebo Dublin Core). Může však být užitečným nástrojem k výměně informací mezi nakladateli a knihovnami. Pozitivní zkušenosti má s využitím ONIXu americká Library of Congress. Ta jej používá např. k zefektivnění programu CIP (Cataloging in Publication), který má za cíl poskytnout knihovně potřebná metadata o dokumentu ještě před jeho publikací a tím ušetřit náklady spojené s katalogizací a usnadnit další knihovnické procesy, např. akvizici.
Dále je ONIX využíván také při získávání informací o obsahu dokumentů. Aby mohlo být využití dat poskytnutých nakladateli co nejefektivnější, vytvořila Library of Congress nástroj, který umožňuje konverzi ONIXu do formátu MARC 21. Přes určité nedokonalosti se jedná o postup, který při tak velkém počtu zpracovávaných záznamů významně šetří čas i finanční prostředky. V evropském prostředí pracuje s ONIXem Německá národní knihovna, která je také součástí národní skupiny pro vývoj standardu.
Situace v ČR
V rámci předběžného průzkumu povědomí o ONIXu v České republice bylo osloveno celkem 13 nakladatelství, která se věnují vydávání elektronických knih. Původním záměrem bylo soustředit se pouze na univerzitní nakladatele, kvůli jejich malému počtu byl však vzorek rozšířen také o neakademickou sféru. Na zaslaný dotazník odpovědělo celkem šest oslovených institucí. Dvě z nich o ONIXu slyšely, nakladatelství Grada pak bylo jediné, které s jeho zavedením experimentovalo. Od užití však upustilo z toho důvodu, že v ČR nikdo jiný s ONIXem nepracuje.
V tom tkví zřejmě jedna z největších překážek v případném přijetí standardu. Takřka všechny oslovené organizace projevily zájem o další informace, pokud ale jiní nakladatelé a distributoři nedokáží ONIX zpracovat, nedává jeho implementace v tuto chvíli smysl. V tomto směru by cestu mohlo otevřít nejen Karolinum, ale také velcí zahraniční distributoři, se kterými česká nakladatelství spolupracují a která ONIX využívají, např. již zmíněné EBSCO. Kontaktovali jsme také některé české majoritní distributory (Kosmas, Martinus, Luxor), bohužel však bez odezvy.
Výstupy
Součástí projektu je také vznik Facebookové stránky (https://www.facebook.com/ONIXCZ1 [6]), která slouží jako podpora a fórum pro sdílení zkušeností s implementací v českém prostředí. Připravujeme také webovou stránku (adresa bude k nalezení na výše zmiňované Facebookové stránce ONIX CZ), kde budou ucelenější informace o formátu v českém jazyce a též užitečné odkazy na zahraniční zdroje.
- ONIX, c2009. EDItEUR [online]. London [cit. 2019-04-15]. Dostupné z: https://www.editeur.org/8/ONIX/ [7]
- ONIX for Books, BISG [online]. New York [cit. 2019-04-15]. Dostupné z: https://bisg.org/page/ONIXforBooks [8]
- DEBUS-LOPEZ, Karl, David WILLIAMSON, Caroline SACCUCCI a Camilla WILLIAMS, 2012. Bringing Publisher Metadata Directly to the Library: Use of ONIX at the Library of Congress. Library Resources & Technical Services [online]. 56 (4) [cit. 2019-04-15]. ISSN 2159-9610. Dostupné z: https://journals.ala.org/index.php/lrts/article/view/5078/6154 [9]
- ONIX for Books: Implementation and Best Practice Guide [online]. 2014 [cit. 2019-07-07]. Dostupné z: https://www.hanmoto.com/pub/onix/ONIX_for_Books_Global_Best_Practice_3.0.2.html [10]
- BEKY, Endre L. ONIX: Is There a Return on Investment for All Publishers?. Publishing Research Quarterly [online]. 2004, 20(2), 3-8 [cit. 2018-11-22]. ISSN 10538801.