XML - formát elektronické komunikace budoucnosti
XML, zjednodušeně řečeno, představuje účelově vytvořenou podmnožinu obecného metajazyka SGML (Standard Generalized Markup Language), který slouží k definování konkrétních aplikací - značkovacích jazyků, z nichž nejznámější je asi HTML jako základního nástroje zpřístupnění informací v prostředí World Wide Web. XML zachovává základní atribut SGML: soustřeďuje se - na rozdíl od HTML, jehož perspektivním nástupcem se má XML stát - na specifikaci obsahové struktury na úroveň jednotlivých elementů, zatímco způsob prezentace daného dokumentu (či celé sady dokumentů) se stanoví výhradně pomocí stylů, jejichž deklarace může být uložena v samostatném souboru. Některá metadatová schémata (např. Text Encoding Initiative a Encoding Archival Description, která vznikla na základě normy SGML, jsou dnes uváděna v soulad s XML). Toto striktní oddělení tzv. procedurálního markupu (formátování) a popisného markupu (obsah) znamená pro další vývoj Internetu revoluční změnu. Z prognózy konsorcia W3C vyplývá, že v roce 2002 bude 75 procent dokumentů šířených po Internetu zpracováno ve formátu XML.
Od února 1998 (práce na tomto projektu však započaly v roce 1996), kdy konsorcium W3C, které má na starosti koordinaci normalizačních aktivit týkajících se Internetu, vydalo prvotní doporučení XML 1.0 (pracovní návrh jeho revize [5] byl zveřejněn 14. srpna 2000), přestal postupně XML figurovat jako novinka s nejasnou budoucností či okrajová záležitost, která je předmětem zájmu pouze omezeného okruhu zasvěcených lidí. Odborný a populárně-naučný tisk v oboru výpočetní techniky začaly plnit - a tento trend můžeme sledovat pochopitelně také u nás, na čemž se podílí právě i Jiří Kosek - články vyzdvihující možnosti, které XML z hlediska elektronického publikování a šířeji z hlediska elektronické komunikace skýtá.
Je zřejmé, jak bylo již naznačeno, že XML bude hrát rozhodující roli pro kódování metadat jako odvozených, popisných dat, která jsou nezbytná pro efektivní manipulaci s primární daty - zpřístupnění, vyhledávání a také dlouhodobé uchování (vzpomeňme na tomto místě dvě iniciativy: jednak zatím nepříliš podporované metadatové schéma Dublin Core [6], které se však těší značné popularitě a publicitě, a jednak Resource Description Framework [7], pocházející opět z dílny W3C, který umožňuje spojovat elementy z různých schémat a tak překonávat dosavadní značnou míru jejich vzájemné nekompatibility). Metadatová schémata založená na XML jsou dnes implementována převážně v elektronickém obchodu (např. ebXML [8]), v některých vědních oborech využívajících formalizovaný jazyk (MathML [9]) a nakladatelské činnosti (DocBook). Této problematice je proto pochopitelně věnována pozornost i v knihovnických kruzích v souvislosti s rostoucím počtem elektronických dokumentů, zejména těch, které jsou vydávány na Internetu (i když XML není určen výhradně pro tyto účely) a z nichž některé jsou výsledkem seriózně míněných aktivit. V zahraničí se realizují pilotní projekty (např. Nordic Metadata II [10], realizovaný od roku 1999 v několika informačních institucích ze skandidávských zemí), jejichž cílem je tyto dokumenty - právě pomocí XML - registrovat jako legitimní součást národní produkce, i když je třeba přitom se chopit metod naprosto odlišných od těch, které se používají v případě tradičních dokumentů.
Přestože text na několika místech působí dojmem, že byl šitý horkou jehlou, svého záměru - zasvětit do základů XML - se Kosek zhostil vcelku s úspěchem. Vyhnul se totiž dvěma možným (dodejme: extrémním) přístupům k výkladu: přílišné trivializaci na jedné straně a nezáživnému technicistnímu stylu, který je pro drtivou většinu potenciálních čtenářů nesrozumitelný, na straně druhé. Správně zvolil vyváženou, "zlatou střední cestu", která bude vyhovovat jak laikům (nikoliv však úplným začátečníkům v práci s internetovskými službami), tak rutinérům v oboru web-publishing, kteří si chtějí obohatit své znalosti. Obě skupiny brzy s knihou v ruce pochopí, proč a jak málo mohou očekávat od HTML, navzdory jeho dosavadním zlepšením!
Jak jsme již u Koska zvykli, jeho styl je úsporný až jednoduchý, ale u literatury tohoto typu tato skutečnost není na škodu. Výsledkem je relativně ucelený průvodce pro XML (pravda, s různou mírou podrobnosti v různých částech), který můžeme hodnotit jako vhodné východisko pro další studium a - to hlavně - pro vlastní pokusy na tomto poli. Doprovází jej obrázkovými ukázkami, příklady zdrojových kódů a odkazy na související elektronické zdroje. Ty musíme brát s vědomím, že publikace o Internetu mají obecně přirozeně krátkou platnost a že je třeba doporučit sledovat aktuální vývoj v dané oblasti na specializovaných portálech (např. XML.com [11], příslušná sekce Web Designer`s Virtual Library [12], novinky o XML [13] (a příbuzných tématech - XHTML, XSL atd.) technického charakteru přináší W3C na svém serveru). Neměli bychom opominout nabídku samotného autora na jeho vlastních stránkách (http://www.kosek.cz/xml [14]).
Kniha je rozdělena do devíti kapitol. V té úvodní autor seznamuje se stěžejními přednostmi XML, dále v textu rozvedenými v konkrétních souvislostech, kterými se XML jakožto otevřeného formátu pro výměnu dat na různých úrovních vyznačuje ve srovnání s HTML. Následující kapitola obsahuje pravidla syntaxe XML, která je definována - stejně jako v SGML - v textovém souboru nazvaném DTD (Document Type Definition) a která není zdaleka tak benevolentní vůči chybám jako v HTML (např. neukončení či nesprávné vnoření párového tagu). Velký potenciál XML se skrývá v novém způsobu odkazování (oběma směry, na více dokumentů najednou či dokonce v rámci hierarchické struktury) pomocí speciálních jazyků XLink, XPointer a XPath. Totéž lze říci o stylovém jazyku XSL, který doplňuje a nahrazuje tzv. kaskádové styly (CSS), které se uplatňují již v HTML 4 a rozšiřují jeho omezené možnosti v typografické úpravě. Jádro knihy tvoří část zabývající použití XML v praxi, přičemž je opakovaně uvedeno, že rozvoj XML je primárně ovlivněn podporou ze strany producentů prohlížečů a dalších softwarových aplikací. V tomto směru bude asi nadále platit (na základě zkušeností s HTML), že doufat v stoprocentní unifikaci by bylo marné. Nicméně současné verze nejrozšířenějších prohlížečů vlévají do žil trochu optimismu (MS Internet Explorer 5.5, jehož ostrá verze se objevila v červenci tohoto roku, a Netscape 6, jehož druhá vývojová verze - Preview Release 2 - byla uvolněna v srpnu 2000). Vedle nich však existují produkty malých softwarových firem (např. InDelv 0.6 [15] či DocZilla Alpha 3 [16]), které se programově orientují na XML, ale stěží se dá předpokládat, že by mohly ohrozit výsadní postavení výše zmíněných programů. O něco rozmanitější nabídka vládne v oblasti XML editorů (můžeme zde jmenovat např. XMLWriter 1.0 [17] nebo nenáročný XML Notepad 1.5 beta [18] od Microsoftu, který je k dispozici zdarma ke stažení), z nichž některé jsou z kategorie WYSIWYG.