Sorry, you need to enable JavaScript to visit this website.

Bílá kniha OECD: Potřebujeme publikační standardy pro datové sady a tabulky

Čas nutný k přečtení
4 minut
Již přečteno

Bílá kniha OECD: Potřebujeme publikační standardy pro datové sady a tabulky

0 comments
Rubrika: 


GREEN, Toby. We Need Publishing Standards for Datasets and Data Tables [online]. Paris : OECD Publishing, 2009 [cit. 2009-05-20]. 29 s. OECD Publishing White Paper. Dostupné na WWW: <http://dx.doi.org/10.1787/603233448430>. doi: 10.1787/603233448430.

V letošním roce vydala Organizace pro ekonomickou spolupráci a rozvoj (OECD) studii „We need publishing standards for datasets and data tables“. Autorem studie je Toby Green, vedoucí publikačního oddělení OECD, který v závěru děkuje dalším kolegům, již se na práci podíleli.

Tato studie by neměla uniknout pozornosti nikoho, kdo se zajímá o problematiku vědeckého publikování a zpřístupňování vědeckých informací. Upozorňuje na další možnosti odstranění informačních bariér ve zpřístupnění výsledků výzkumu a vývoje, a to těch, které jsou uloženy ve formě publikovaných datových sad [1].

Rozšíření virtuálního prostředí i stále vyšší kapacita výpočetní techniky umožňuje předávat výsledky výzkumu nejen literární formou článku, ale zpřístupňovat i celé datové soubory, které v rámci výzkumu vznikly a jsou v textu článku komentovány.

OECD již od roku 2000 zpřístupňuje službou StatLinks na internetu tabulky, které jsou zároveň publikovány v textu knih nebo článků (tištěných i elektronických). Tyto tabulky jsou na stránkách OECD přístupy nejen ve formátu shodném s publikovanou verzí, ale včetně zdrojových dat, tedy výstupů tabulkového procesoru, s různými variantami zobrazení (graf, tabulka aj.). Tyto tabulky mají přidělen perzistentní identifikátor DOI (digital object identifier), který slouží k přesné navigaci mezi textem a tabulkou.

Datové soubory a tabulky jsou v odborné komunikaci velmi často citovány, ovšem způsob citování těchto zdrojů zatím není standardizován [2]. A to navzdory tomu, že právě tento přístup k primárním datům čtenáři odborných textů preferují a vyžadují.

V části práce se T. Green zmiňuje o souvisejících aktivitách v oblasti zpřístupňování datových informačních zdrojů. Za pozornost určitě stojí iniciativa TIB – Technische Informationsbibliothek und Universitätsbibliothek Hannover. 2. března 2009 na setkání International Council for Scientific and Technical Information (ICSTI) v Paříži bylo mezi několika evropskými pracovišti uzavřeno memorandum o porozumění European initiative to facilitate access to research data. Toto memorandum obsahuje ideu projektu registru datových sad (možná přesněji řečeno znalostních databází), které jsou výstupy evropského výzkumu a vývoje, a zároveň zprovoznění resolveru perzistentních identifikátorů těchto informačních zdrojů.

Hlavním cílem studie OECD je návrh standardů metadat pro popis datové sady a tabulky, včetně variant jejich souborů. T. Green zdůrazňuje, že koncepce navrženého formátu vychází z požadavku přijatelnosti a snadné integrace do práce tří subjektů zapojených do procesu publikování vědecké informace – vydavatelů, kteří data vytvářejí, knihovníků, kteří data zpřístupňují, a uživatelů, kteří informace potřebují. Jeden z prostředků splnění tohoto cíle je kompatibilita nového standardu s metadatovými schématy MARC21 nebo ONIX. Ve studii T. Greena je zdůrazněno, že knihovní katalog je neopominutelným zdrojem pro vyhledávání odborných informací [3].

Návrh základního metadatového formátu obsahuje přes 20 elementů, nicméně sám autor navrhuje pro citování publikované datové sady nebo tabulky vytvoření citace pouze s několika málo prvky a identifikátorem DOI.

Ve studii je také zmíněno několik problémových okruhů:

  • zatím ne zcela přesně vyjasněná otázka citování dynamických databází, které jsou průběžně a nevratně měněny;
  • datové sady publikované seriálově, tedy patřící k typu pokračujících děl;
  • různé datové formáty souborů generovaných z jediné datové sady či jazykové mutace obsahově shodných datových sad.

V závěru studie je uvedeno, že OECD rozšíří počet datových sad i tabulek identifikovaných pomocí DOI, včetně jejich zpřístupnění přes systém CrossRef pro tvůrce vědeckých knih a časopisů a jejich čtenáře.

T. Green doufá, že iniciativa OECD najde podporu a datové sady se stanou běžnou součástí zdrojů nezbytných pro práci ve výzkumu.

Text We need publishing standards for datasets and data tables doporučuji nejen jako velmi přínosné „čtení“, ale i jako rozcestník k dalšímu studiu, neboť referečních zdroje, které T. Green uvádí, jsou pro zájemce o problematiku vědeckých informací jistě užitečné. A navíc, je přece jasné, že i čtenáře Ikara nejvíce zajímají zdrojová data…

Poznámky:
  1. Termín „datová sada“ je převzat z Česká terminologická databáze knihovnictví a informační vědy (TDKIV), ekvivalent anglického „dataset“. T. Green se zmiňuje též o problematice typologického určení dokumentu „dataset“ v knihovních katalozích (OPAC). Během psaní jsem se přikláněla spíše k termínu „znalostní“ nebo „expertní“ databáze. Termín datová sada však vystihuje situaci, kdy se jedná o publikovanou část rozsáhlejší, např. výzkumné databáze.
  2. Zmíněn je např. průzkum v článcích databáze ScienceDirect.
  3. T. Green cituje tuto práci: INGER, S.; GARDNER, T. How readers navigate to scholarly content :comparing the changing user behaviour between 2005 and 2008 and its impact on publisher web site design and function [online]. Abingdon (Velká Británie) : Simon Inger Consulting; Tracy Gardner Marketing, 9th September 2008 [cit. 2009-05-20]. 32 s. Dostupné na WWW: <http://www.sic.ox14.com/howreadersnavigatetoscholarlycontent.pdf>.
Klíčová slova: 
Hodnocení: 
Zatím žádné hodnocení
ŘÍMANOVÁ, Radka. Bílá kniha OECD: Potřebujeme publikační standardy pro datové sady a tabulky. Ikaros [online]. 2009, ročník 13, číslo 6 [cit. 2020-07-07]. urn:nbn:cz:ik-13175. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/13175

automaticky generované reklamy
registration login password