• Bejelentkezés
  • Szócikk
  • Vitalap
  • Lapforrás
  • Laptörténet
  • A Fogalomtár wikiből

    XML

    Az XML (eXtended Markup Language) a webes világban elterjedt HTML (HyperText Markup Language) és a kevésbé ismert SGML (Standard Generalized Markup Language) rokona. Mindegyik úgynevezett "markup" azaz jelölőnyelvben - vagyis olyan adatformátumban, ahol az adat és az adatra vonatkozó metainformáció (ideértve az adatszerkezetet vagy a megjelenítési, formázási utasításokat) egy közös állományban található - az utasítások és metainformációk az adatok közé ékelt jelek formájában találhatók.

    Az XML formátum ugyanolyan névvel ellátott elemekből áll, mint a HTML, az elemeknek nevük mellett attribútumaik lehetnek. Az elemek amelyeket "< >" jelek ("kacsacsőrök ") közé zárt nevük azonosít, tartalmazhatnak adatot vagy további elemet.
    Például az alábbi egy szabályos XML állomány részlete lehet:

    <első_elem>
        Ez az elem szöveget, 1 számot és egy belső elemet tartalmaz
        <belső_elem paraméter="3">
            Látható, hogy az elemeknek nemcsak tartalma, hanem paraméterei is lehetnek.
            A következő jel a belső elem végét jelzi.
        </belső_elem>
        A következő jel a külső elem végét jelzi
    </külső_elem>
    


    Az XML azonban - ellentétben a HTML-lel - szigorúan fa-szerkezetet alkot, vagyis egy elemen belül lehetnek további elemek, de átfedő elemek nem lehetségesek.

    Műveletek XML dokumentumokon

    Validálás

    Az XML állományok formáját (nyelvtanát) pontosan meg lehet határozni a régebbi DTD, vagy az újabb XML Schema szintaxisleíró dokumentumok segítségével. (Utóbbi érdekessége, hogy maga is XML állomány, aminek így természetesen van szintaxisa, ami szintén leírható XML Schemában.) Validálásnak nevezzük annak az ellenőrzését, hogy egy XML dokumentum megfelel-e egy bizonyos szintaxisnak.

    Értelmezés (parsing)

    Az XML dokumentumok feldolgozásához, értelmezéséhez (parsing) számos programozási nyelv és programkönyvtár nyújt segítséget. XML-t értelmezni alapvetően kétféle megközelítéssel lehet:

    • a SAX (Simple API for XML) eseményalapú értelmezést tesz lehetővé; az XML-ből bejövő elemek mint események jelentkeznek az értelmező számára, amely ezekhez az eseményekhez kezelőket társíthat
      • ennek előnye, hogy az igen nagy állományok is feldolgozhatók viszonylag kis memóriaigény mellett;
    • a DOM (Document Object Model) értelmezők először a teljes dokumentumot a memóriában adatszerkezettel reprezentálják, mielőtt bármilyen feldolgozási művelet megtörténne
      • bizonyos összetett dokumentumok csak így elemezhetők (pl. OWL állományok), mert az állomány egymástól távoli részei hivatkozhatnak egymásra,
      • viszont egyértelmű hátránya a módszernek a nagy memóriaigény.

    Megjelenítés és átalakítás

    Az XML dokumentumok megjelenése testreszabható a HTML-nél megszokott stíluslapok segítségével. Léteznek módszerek az XML dokumentumok (XML-ben leírt) szabályok szerinti átalakítására is (XSLT, XPath).

    (Folytatjuk)