Citační databáze Web of Science a další produkty Thomson Reuters pro hodnocení vědeckých výstupů – aktuální novinky
Již na podzim proběhla informace o novém citačním rejstříku pro sborníky z konferencí, avšak změn, které Web of Science (dále WoS) přichystal, je mnohem více, a to včetně velkých novinek týkající se samotného impakt faktoru (dále IF). Na semináři, který se konal na půdě Akademie věd ČR na konci února 2009, novinky nastínili a zároveň představili další produkty určené především k hodnocení vědeckých výstupů a dalším analýzám zástupci producenta databáze Thomson Reuters, manažerka pro oblast bibliometrie a hodnocení vědy Ann Kushmericková a produkt manažer David Horký.
Analýzy odborných časopisů
Podíváme-li se nejprve na historicky nejsilnější doménu Ústavu pro vědecké informace (Institute for Scientific Information), a to analýzu časopisů, úplnou novinkou je JADE – Journal Analysis Database Expanded. Tato databáze překračuje tradiční hranice a propojuje citační data s vlastními informacemi předplatitelů. Používá na prvním místě dat a metriky WoS a propojuje jej s nástrojem OpenIdentify, který slouží k identifikaci a sběru informací o zainteresovaných stranách. JADE pak nabízí celkový pohled na jednotlivé časopisy – a to formou přehledu institucí, které kdy publikovaly, byly citovány nebo citovaly v daném seznamu časopisů. Kromě jednoznačné výhody identifikace institucí databáze přináší především cenné informace pro knihovny institucí a vydavatele časopisů. Již starší, ale u nás málo známý nástroj je Journal Use Reports, je určen především knihovníkům a administrátorům elektronických zdrojů, neboť sbírá, propojuje a analyzuje data o užití časopisů, metriky z Journal Citation Reports (dále JCR), data instituce o publikacích a informace o článcích z WoS.
Pětiletý impakt faktor a další změny v citačních rejstřících
Právě v JCR došlo k velmi výrazným změnám. Byl zaveden pětiletý IF, který má přinést lepší náhled na hodnocení časopisů. Dosud používaný (a jediný) IF s dvouletým intervalem byl zcela původně postaven na analýze oblasti genetiky. Již zpočátku bylo zřejmé, že dvouletý IF časopisy z oborů, které jsou tzv. „pomalejší“ a nejvyšší úhrn citací vůči publikacím dosahují až po delší časové periodě, zcela nevyhovuje. To ostatně můžeme pozorovat i na obr. č. 1, kde je vidět, že pro obor informační vědy a knihovnictví je mezi jednotlivými IF velký rozdíl, přičemž pětiletý je vždy vyšší. Zavedení pětiletého IF je rozhodně přínosem, pokud jej však nemůžeme srovnat s dvouletým IF, nepřináší bohužel svůj zamýšlený užitek ve smyslu porovnávání periodik z různých oborů. Nabízí se vyvinutí normalizovaného indikátoru, který by právě tyto dva IF skloubil.
Obr. č. 1: Tabulka Journal Citation Reports ze Social Science Citation Index za r. 2007 pro obor informační věda a knihovnictví
Zdroj: Journal Citation Reports, Social Science Citation Index, r. 2007
Na obr. 1 můžeme dále pozorovat další novou metriku Eigenfactor a její dva indikátory Eigenfactor Score a Article Influence Score. Metrika byla vyvinuta právě na datech z WoS, ale nezávislou laboratoří. Eigenfactor je metrika nového ražení, která se vymaňuje z tradičního pojetí pouhého počítání publikací a citací. Zapojuje novodobě dostupná data, zejména ta, která vznikají a jsou zaznamenávána jako data o využívání zdrojů a pohybu uživatele po síti odborné literatury. Více o ní se dozvíte v článku Hodnocení a mapování vědy pomocí portálu Eigenfactor.org.
V přehledu o časopisu JCR je dále nově uveden údaj o pozici v rámci kategorie. Pozice se uvádí pro všechny kategorie, do kterých je časopis zařazen; konečně je tak možné nahlédnout na časopisy efektivně nehledě na samotnou absolutní hodnotu impakt faktoru. Přínosem to zcela jistě bude i pro obraz interdisciplinárních periodik. Tuto informaci navíc doplňuje tzv. krabicový graf (box plot diagram), který ukazuje rozložení časopisů podle impakt faktoru. V JCR byla vylepšena informace o autocitace. Je k dispozici procentuální poměr autocitací vůči všem citacím v letech, ze kterých je vypočten IF, a hodnota IF redukovaná o autocitace. Autocitace se promítají také v grafu, který zobrazuje přijaté citace v jednotlivých letech.
ResearcherID
Již delší dobu je na světě portál ResearcherID, jež je určen pro jednoznačnou identifikaci vědců. Portál je zdarma, funguje na principu registrace vědce a ukládání informací do vlastního profilu (k dispozici je i hromadný import informací za celou instituci). Tato data jsou pak propojována se záznamy ve WoS. Hlavním účelem je zlepšit kvalitu dat a umožnit tak smysluplnější analýzy s větší výpovědní hodnotou o přínosu, vývoji a aktivitách jednotlivých vědců, potažmo institucí či států. Zkvalitnění dat se pak projeví v každém z analytických nástrojů Thomson Reuters, např. Institutional Citation Report. Portál sám o sobě nabízí několik nástrojů, např. analýzy spolupráce či interaktivní geografické mapy citací. Je nutné dodat, že v tomto stále WoS citelně zaostává za databází Scopus, která má jednoznačné identifikátory vědců zavedeny od počátku, a to rovnou v databázi s přímou vazbou na uživatelskou podporu, jejímž prostřednictvím je možné upozorňovat na chyby a omyly. Takové opravy navíc nemusí zadávat pouze konkrétní vědec či knihovník, ale kdokoliv.
Analytické nástroje Thomson Reuters
Thomson Reuters na základě dat z WoS, které má k dispozici, produkuje několik standardizovaných nástrojů pro konkrétní typy zákazníků, které umožňují hodnocení daných entit, a to Science Indicators a Citation Reports. V obou případech se (na obecné úrovni) jedná o vybranou sadu záznamů z WoS ze zvolené časové periody doplněnou o vstupní data subjektu, např. o počet obyvatel, resp. zaměstnanců. Science Indicators je nástrojem více přehledovým a spíše srovnávacím, Citation Reports jsou detailní data a analýzy konkrétního subjektu. Tyto nástroje jsou poskytovány jako databáze MS Access s nadefinovanými analytickými výstupy a grafickým rozhraním. Každou databázi je nutné zvlášť zakoupit.
Pro hodnocení vědeckého výkonu zemí a jejich srovnávání je k dispozici databáze National Science Indicators. Obsahuje data za léta 1981-2008 s možností každoroční aktualizace. Za dostupné analýzy uveďme nejprve základní vývoj počtu publikací a počtu citací v dané zemi; podle těchto indikátorů je pak srovnáván výkon zemí v jednotlivých oborech. Je sledován podíl oborů v zemi a vývoj těchto podílů. Zajímavá a cenná jsou porovnání zemí podle relativního ohlasu dané země vůči světu, vývoj relativního ohlasu a jeho srovnání s jednotlivými zeměmi.
Na úrovni institucí obdobné analýzy nabízí Institutional Citation Report. Pro instituci máme k dispozici sadu jak citovaných, tak citujících dokumentů. Analogicky lze pak získat analytické informace o celkovém výkonu, oborech a jejich podílech, jednotlivých vědcích či jejich skupinách a definovanému tématu. Konkrétně lze takto u instituce získat celková data o počtu publikací, citací, průměrné citovanosti typů dokumentů, dále kolik z dokumentů se vyskytuje ve světové špičce či s kým daná instituce spolupracuje.
U autorů je v Institutional Citation Report možné zjišťovat kromě opět typických souhrnných informací (jako jsou počty publikací a citací) také počty sekundárních citací (tj. citací dokumentů, které citovaly původní článek autora), očekávaný počet citací či percentil autora v daném oboru (tj. pozici autora v oboru v rámci celého světa). U autora jsou k dispozici další indikátory včetně H-indexu, počty autocitací či procento citovaných publikací. Novinkou jsou odvozené indikátory C-index pro skupinu publikací vyjadřující vztah aktuálních a očekávaných citací (celkový počet aktuálních citací vůči součtu očekávaných citací), průměrný percentil skupiny publikací indikující jejich celkový ohlas (počty citací jsou normalizovány na rok a obor) a konečně Disciplinarity Index (neboli tzv. Herfindal Index), který odráží míru multidisciplinarity publikací. U autora lze také určit, které instituce jej nejčastěji citují, a poměr jeho hodnot indikátorů v daném oboru v zemi/instituci. Autory je možné podle jednotlivých indikátorů srovnávat (viz tab. č. 1).
Tab. č. 1: Porovnání autorů z oboru fyzické chemie podle jednotlivých indikátorů
Zdroj: převzato z prezentace Ann Kushmerickové
Pro instituci jsou pak k dispozici další analýzy z oblasti spolupráce, např. nejprestižnější spolupracující instituce nebo nejčastěji spolupracující instituce. Na základě těchto dat, např. indikátoru nejvíce citujících institucí, pak může instituce vyvodit, se kterými z nich by mohla navázat spolupráci. Mezi výstupy nechybí ani analýza trendů v jednotlivých oborech.
Stejný typ dat může být připraven pro jakoukoliv zemi, a to pod názvem National Citation Report. Tato databáze zpracovává analýzy všech vědců z dané země a jejich publikací a analyzuje trendy ve výzkumu a vývoji dané země.
Obdobně, jako je zpracována databáze National Science Indicators, je k dispozici také mutace pro srovnávání institucí v rámci jedné země. Lze ji vytvořit na požádání pro kteroukoliv zemi, předpřipraveny jsou pouze pro USA, Velkou Británii, Kanadu, Austrálii a Japonsko. Instituce lze pak porovnávat jako vždy podle počtu publikací a podle vývoje počtu citací. Podle relativního ohlasu se určuje, která z institucí měla v dané časové periodě větší přínos. Na úrovni oborů lze sledovat relativní citační ohlas institucí a jejich zaměření na dílčí disciplíny.
InCites
Velkou novinkou je březnové spuštění analytického nástroje InCites, díky kterému lze prostřednictvím webového rozhraní provádět analýzy a srovnávání vědecké výkonnosti. Nabízí mnoho výstupů: přehledy počtů publikací a citací pro instituce či země, nejvlivnější publikace, vycházející vědecké hvězdy, h-index autora či oddělení instituce, zaměření instituce a jeho trendy a v neposlední řadě analýzy spolupráce. Portál je placený, v ČR k dispozici není.
Závěrem
Web of Science a citační rejstříky se svým způsobem nacházely ve složité situaci. Vlivem velmi dlouhého vývoje se potýkají rozhodně s větší rigidností svých databází a nástrojů než např. mladičký konkurent Scopus. Na úrovni současných technologií navíc není problém pro menší databáze, aby také sledovaly citace a přidaly jednoduché nástroje k jejich vyhodnocování. Byť možná malicherným, tak velmi diskutovaným tématem je zneužívání impakt faktoru v hodnocení vědy, což vede k jisté zaujatosti vůči citačním rejstříkům, odkud je IF autoritativně stahován. Producent Thomson Reuters však udělal velké kroky; je vidět, že se velmi usilovně snaží dohonit vlak, o němž se v jednu chvíli zdálo, že začíná ujíždět. Připravené novinky jsou rozhodně velkým přínosem pro rozvoj hodnocení vědy na základě dat z citačních databází, ať už hovoříme o pětiletém impakt faktoru či metrice Eigenfactor, která poskytuje alternativní náhled na hodnocení časopisů, aniž by zpochybňovala výpovědní hodnotu metrik založených na počtech citací a publikací. Analytické nástroje včetně rozhraní InCites jsou velkou pomocí jak pro reálný proces hodnocení vědy v politickém měřítku, tak pro samotné hlavní činitele ve vědě a výzkumu, kterým usnadňuje přehled o aktuální situaci, vývoji dané oblasti a výhledu do budoucnosti.