Deel 1: de theorie. Een website bouwen of een multimediapresentatie maken? Dat doet u eenvoudig met xml. Xml groeit langzamerhand uit tot een standaardformaat van allerlei documenten, en bedrijven zien het als een prachtige oplossing voor gegevensoverdracht. Maar: hoe werkt het precies en waarom is het zo handig? Deze maand: de theorie

"Om goed te kunnen begrijpen hoe xml werkt, leggen we nog even kort uit hoe het ook weer zat met de lingua franca van alle webpagina's: html (hypertext markup language). Open voor een voorbeeld een willekeurige webpagina in uw browser en roep via het menu Beeld de broncode van die pagina op. Waarschijnlijk belandt u nu middenin een reeks labels (markup tags). De oorspronkelijke bedoeling van html was om via zulke tags de logische structuur van het webdocument aan te geven. Voorbeelden van zulke tags zijn

(alinea),

(een titel van niveau 3) en(een lijst-item). Al snel kwamen er tal van tags bij die vooral voor een mooiere lay-out moesten zorgen: (cursieve tekst), (het lettertype) of (een lichtkrant, herkend door Microsoft-browsers). Stel nu dat u het recept van uw favoriete streekgerecht in een webpagina wilt gieten, dan zou (een stukje van) de html-broncode er als volgt uit kunnen zien:Overmeerse kneutelsDeegbollen gekookt in water (4 ps.)1000 gramzelfrijzende bloem2eieren200 gramrozijnen1,5 kopjesprankelend waterMeng alle ingrediënten goed door elkaar, tot er een soort brooddeeg ontstaat.
Schep hier deegbollen van en leg die 7 minuten in kokend, licht gezouten water.
Dien warm op en overgiet met gecondenseerde zoete melk.***htmlcss.tif Html + css Css Dergelijke html-code heeft echter enkele typische tekortkomingen. Wilt u bijvoorbeeld de lay-out van deze pagina ingrijpend verfraaien, dan wordt de broncode door al die extra tags meteen een stuk onoverzichtelijker. En wilt u achteraf de lay-out van al uw receptenpagina's wijzigen, dan vergt dat een aanpassing van elke pagina afzonderlijk. Dit is natuurlijk niet erg praktisch en daarom werd css (cascading style sheets) in het leven geroepen. Met css is het namelijk mogelijk om de lay-outgegevens te scheiden van de eigenlijke inhoud van het document; stopt u dus alle stijlinformatie in een apart bestand én roept u dit bestand vanuit uw webpagina's op, dan hoeft u alleen dit ene bestand te wijzigen om meteen een andere lay-out voor uw complete site te krijgen. Zo zou u deze volgende verwijzing in uw html-bestand kunnen opnemen: . Vervolgens kunt u in de juiste map (in ons voorbeeld: stijlen) het bestand receptenstijl.css creëren en daarin vastleggen hoe bijvoorbeeld een-tag er precies moet uitzien: H1" { "color: red; background-color: yellow; " "font-family: Arial, Helvetica; " "} ***xml.tif Xml geeft structuur aan uw inhoud Xml Ookal is css een elegante oplossing voor stijlfreaks, het geeft de pagina inhoudelijk niet per se een duidelijker opbouw. Stel dat een uitgeverij dergelijke pagina's binnenkrijgt om er een kookboek mee samen te stellen, dan is het nog heel veel werk om hieruit alle informatie correct te distilleren. Met xml - dat staat voor eXtensible markup language - is dit wel mogelijk, namelijk door specifieke markup tags te gebruiken die nauwkeurig de aard van de informatie aangeven. Als voorbeeld: <?xml version=”1.0”?> Overmeerse kneutels Deegbollen gekookt in water 4 1000 gram zelfrijzende bloem Meng alle ingredienten goed door elkaar, tot u U begrijpt dat het voor die uitgeverij met behulp van een xml-parser ('ontrafelaar') al een stuk makkelijker is om hieruit de nodige informatie te halen. Immers, de typische onderdelen van een recept (zoals titel, omschrijving, aantal personen, hoeveelheden) hebt u precies benoemd in de vorm van tags. Het feit dat u dus zélf tags kunt toevoegen verklaart de x in xml (extensible betekent uitbreidbaar). Maar u moet nóg twee horden nemen: stijl enerzijds en definities en schema's anderszijds. ***xmlcss.tif Xml en css: een stijloefening. ***xmlxsl.tif Xml en xsl: een krachtig duo. Stijl Probeert u het xml-bestand maar in uw (xml-compatibele) browser te openen. Die kan weliswaar overweg met uw xml-code, maar die doet er weinig meer mee dan de onderliggende boomstructuur van uw code interpreteren en weergeven (zie afbeelding). De root is in dit geval , die op zijn beurt bestaat uit de elementen , , , . Uw browser heeft dus nog een mechanisme nodig waarmee hij de xml-code in de gewenste lay-out kan gieten. Dat kan op verschillende manieren; u kunt bijvoorbeeld vanuit deze xml-pagina naar een css-bestand refereren. Vanuit dat bestand bepaalt u dan voor elk element het gewenste uiterlijk. Neemt u deze verwijzing bovenaan in uw xml-code op: <?xml-stylesheet href=”stijlen/recept.css” type=”text/css”?> dan kunt u bijvoorbeeld het element als volgt stileren in dat css-bestand: materie { font size: 14 pt; font weight: bold; color: green; background-color: lime; } Css heeft echter met enkele beperkingen te maken. Zo kunt u hiermee niet de elementen uit het brondocument in een andere volgorde afbeelden, u kunt er ook geen tekst of afbeeldingen aan toevoegen, u kunt geen criteria bepalen op grond waarvan bepaalde elementen al dan niet getoond worden en u kunt er geen berekeningen mee laten uitvoeren. Anders gezegd: de structuur van het xml-document kan het beste niet té ver uit de buurt van de uiteindelijke vormgeving liggen die u (als auteur) beoogt. Dit kan wél met het krachtige xsl(t) (extensible stylesheet language transformations). Zo'n extern xsl-bestand roept u vanuit het xml-document op dezelfde wijze op als een css-bestand: <?xml-stylesheet href=”stijlen/recept.xsl” type=”text/xsl”?>. Het voert te ver om de mogelijkheden van deze taal gedetailleerd te bespreken, maar hiermee krijgt u wellicht toch al een aardig idee:U merkt dat zo'n xsl-bestand al een beetje op een heuse programmeertaal begint te lijken. Zo hebben we hier bijvoorbeeld een soort van lus opgenomen (for-each) die het hele xml-document afspeurt naar het -element. Binnen zo'n xsl-bestand kunt u verder ook de (x)html-tags van allerlei eigenschappen voorzien (in ons voorbeeld: h1, h2 en u). Definities en schema's U bent nu al een flinke stap verder: de uitgeverij kan probleemloos de structuurelementen uit uw xml-documenten halen én er eventueel snel de gewenste lay-out op toepassen. Het xml-document noemen we in dit geval 'well formed'. Maar wat als verschillende personen hun favoriete streekgerechten doorsturen naar die uitgeverij? Dat hoeft natuurlijk geen probleem te zijn, zolang iedereen gebruikmaakt van precies dezelfde xml-boomstructuur met identieke elementen. De uitgeverij doet er dan ook goed aan om een schemadocument (soort syntax-sjabloon) op te stellen dat de inhoudelijke structuur van de xml-documenten precies vastlegt. Dit document kan de uitgeverij dan (online) ter beschikking stellen. Iedereen die streekgerechten doorstuurt, hoeft dan slechts in zijn xml-document naar dat schemadocument te verwijzen. Zo'n document is dus al iets meer gestandaardiseerd en noemen we 'valid' (versus well formed). Aanvankelijk nam zo'n schemadocument de vorm van een dtd aan (document type definition). Het volstaat in zo'n geval de volgende regel in uw xml-document op te nemen: <?xml version:”1.0”?> . Een geschikt dtd-document zou er voor de uitgeverij dan ongeveer als volgt kunnen uitzien. materie CDATA #REQUIRED> Veeleisende xml-gebruikers botsten echter al snel op enkele storende beperkingen van het dtd-formaat, waardoor het intussen wat uit de gratie is geraakt. Zo kunt u niet aangeven dat 'hoev' (hoeveelheid) hier geen negatief getal mag bevatten, of dat dit alleen geaccepteerd wordt als ook 'materie' aanwezig is. Er staan gelukkig wel al enkele waardige opvolgers van dtd klaar en het lijkt er vooralsnog op dat (W3C) xml schema (definition language) - afgekort als xsd - het pleit wint. Volgende maand deel 2: xml in de praktijk ***Kader Op Het Web Op PCMweb.nl vindt u verschillende voorbeelden van de hier besproken html- en xml-codes. Wilt u zich in verdiepen in xsd, dan vindt u een uitgebreide cursus op www.w3schools.com/schema. Op dezelfde site kunt u ook terecht voor een overzichtelijke xml-gids (www.w3schools.com/xml) en een solide basis voor verder onderzoek vindt u op www.w3.org/xml.

Deel dit artikel
Voeg toe aan favorieten