[LinuxFocus-icon]
LinuxFocus article number 242
http://linuxfocus.org

[Floris Lambrechts]
Floris Lambrechts
<floris/at/linuxfocus.org>

L'autore:

Sono stato il capo editore della versione olandere di LinuxFocus per anni. Sto studiando 'ingegneria elettronica industriale' a Leuven, in Belgio, e perdo il mio tempo giocando con Linux, PHP, XML e LinuxFocus e leggendo libri come quelli di Stephen Hawking e (al momento :) di Jef Raskin, 'The Human Interface'.



Tradotto in Italiano da:
AlessandroPellizzari <alex/at/neko.it>

Arrivare a conoscere XML

[Illustration: xml]

Premessa:

Questa è una breve introduzione a XML. Incontrerete Eddy il meta-gatto, la polizia della sinsatti XML e qualche DTD. Non preoccupatevi, ci spiegheremo. ;)

_________________ _________________ _________________

 

Introduzione

Nell'estate del 2001, alcuni editori di _LinuxFocus_ sono venuti a Bordeaux per l'LSM. Molti interventi e discussioni del gruppo specialistico di documentazione dell'LSM si sono rivelati trattare dello stesso argomento: XML. Lunghe (e divertenti) ore sono state spese spiegando cosa sia esattamente XML, a cosa serve e come si può usare. Nel caso foste interessati, questo è anche esattamente l'argomento di questo articolo.

Vorrei ringraziare Egon Willighagen e Jaime Villate per avermi fatto conoscere XML. Questo articolo è più o meno basato sulle informazioni degli articoli di Jaime, che potete trovare tra i link più sotto.  

Cos'è XML

Noi gente che scrive documentazione sappiamo più o meno cosa sia XML. Dopotutto, la sintassi è molto simile a quella dell'HTML ed è solo un altro linguaggio di markup come SGML e (ancora) HTML, giusto? Giusto. Ma c'è di più.
XML ha alcune proprietà che lo rendono un formato utile per praticamente tutto. Sembra quasi che possa descrivere le cose più complesse e comunque rimanere leggibile dagli umani, e facile da analizzare dai programmi. Come può essere? Investighiamo su questo strano linguaggio.

Eddy, il meta-gatto

Prima di tutto, XML è un linguaggio di markup. I documenti scritti in un linguaggio di markup contengono fondamentalmente due cose: dati e metadati. Se sapete esattamente cosa sono i dati, fatemelo sapere, ma fino ad allora parliamo di meta-dati ;). Detto in modo semplice: i meta-dati sono informazioni extra che aggiungono un contesto, o un significato, ai dati in sè. Un semplice esempio: prendete la frase 'Il mio gatto si chiama Eddy'. Una persona come voi sa che 'gatto' è il nome di una specie di animale, e 'Eddy' è il suo nome. I programmi per computer, d'altra parte, non sono persone e non capiscono queste cose. Quindi usiamo meta-dati per aggiungere un significato ai dati (con la sintassi XML, ovviamente!):

 <frasee>
   My <animale>gatto</animale> si chiama <name>Eddy</name>.
 </frase>

Ora anche uno stupido programma per computer può dire che 'gatto' è una specie, e che 'Eddy' è un nome. Se vogliamo produrre un documento dove tutti i nomi sono scritti in blu, e tutte le specie in rosso, allora XML ce lo rende facile. Giusto per il gusto di vederlo, questo è quello che otterremmo:

 Il mio gatto si chiama Eddy.

Ora, teoricamente, possiamo mettere le informazioni sul layout (i colori in questo caso) in un file a parte, un cosiddetto stylesheet (foglio di stile). Quando lo facciamo stiamo separando le informazioni di formattazione (layout) dal cotenuto, qualcosa che è considerato come il Sacro Graal del WebTM da alcuni. Finora non abbiamo fatto niente di speciale, l'aggiunta di meta-dati è il motivo d'essere dei linguaggi di markup. Quindi cosa rende così speciale XML?

La polizia di sintassi

Prima di tutto, XML ha una sintassi molto restrittiva. Per esempio, in XML ogni <tag> deve avere un </tag> di chiusura. [ Nota: visto che è abbastanza stupido scrivere <tag></tag> quando non c'è nulla in mezzo, potete anche scrivere <tag /> e risparmiare un paio di minuti della vostra vita.].
Un'altra regola è che non potete 'mescolare' i tag. Dovete chiudere i tag nell'ordine inverso rispetto a come li avete aperti. Una cosa come questa non è valida:

<B> Testo in grassetto <I> Testo in grassetto e corsivo </B> Testo in corsivo </I>

Le regole di sintassi dicono che dovreste chiudere il tag </I> prima di chiudere </B>
E fate attenzione che _tutti_ gli elementi di un documento XML dovrebbero essere contenuti nei tag (eccetto i due tag esterni, naturalmente!). Questo è il motivo per cui, nell'esempio sopra, abbiamo inserito i tag <frase> attorno alla frase. Senza di essi, alcune delle parole nella frase non sarebbero state racchiuse da tag e questo, assieme a molte altre cose, fa infuriare la polizia della sintassi XML.
Mozilla screenshot
La polizia di sintassi di Mozilla al lavoro...

Ma una forza di polizia con un certo potere ha i suoi vantaggi: assicura l'ordine. Visto che XMl segue tali strette regole, è molto facile da leggere da parte dei programmi. Inoltre i dati nei documenti sono molto strutturati, il che li rende facili da leggere da parte delle persone.
In effetti la struttura in XML rende possibile scrivere anche database (provateci con HTML! :p). È esattamente quanto ha fatto Egon Willinghagen per la sezione olandese di LinuxFocus, e il suo articolo su tale sistema è disponibile tra i link in fondo alla pagina.
Se riuscite a diventare buoni amici degli analizzatori sintattici ci sono ancora molti modi di far fare alla polizia il vostro lavoro. Ma per farlo dovete usare in modo intelligente una DTD...  

Le DTD

Nel nostro piccolo esempio 'Eddy il meta-gatto' di sopra, abbiamo inventato i nostri tag XML. Naturalmente un atto così creativo non è tollerato dalle forze di polizia! Gli 'uomini in blu' vogliono sapere cosa stiamo facendo, come, quando e (se possibile) perché. Bene, nessun problema, possiamo spiegare tutto con una DTD...

Una DTD permette di 'inventare' nuovi tag. In effetti permette di inventare un linguaggio completamente nuovo, purché segua la sintassi XML.
La DTD, o Document Type Definition (Definizione di Tipo di Documento), è un file che contiene la descrizione di un linguaggio XML. È una lista di tutti i possibili tag, dei loro possibili attributi e delle loro possibili combinazioni. La DTD descrive ciò che è possibile nel vostro linguaggio XML, e cosa non lo è. Quindi, quando parliamo di un 'Linguaggio XML', stiamo parlando di una specifica DTD.

Mettere al lavoro la polizia

A volte la DTD vi forza a fare qualcosa in un punto specifivo. Per esempio, la DTD può forzarvi a includere un tag che contiene il titolo del documento. La cosa interessante è che ci sono software (per esempio, un modulo di emacs) che scrivono automaticamente i tag richiesti.
In questo modo alcune parti del vostro documento vengono riempite automaticamente. Poiché la sintassi è cosí stringente e ben definita, la DTD vi può guidare attraverso il processo di creazione del documento. E quando commettete degli errori, come dimenticare un tag di chiusura, la polizia è lí a farvelo notare. Alla fine, questi poliziotti non sono poi cosí 'furiosi'; invece della frase 'avete il diritto di rimanere in silenzio' della polizia reale, la polizia dell'XML vi dirà amichevolmente 'Errore di sintassi alla linea xx : '... :)
E mentre la polizia fa il lavoro per voi, naturalmente *voi* potete concentrarvi sul contenuto.

Nel miscuglio

Un'ultima grande feature di XML è la sua capacità di usare diverse DTD allo stesso tempo. Questo significa che potete usare diversi tipi di dati contemporaneamente in un documento.

Questo 'miscuglio' viene fatto con i namespace XML. per esempio, potete includere la DTD di Docbook nel vostro documento .xml (con il prefisso 'dbk' in questo esempio).
Tutti i tag di Docbook sono pronti per essere usati nel vostro documento in questa forma (poniamo che ci sia un tag Docbook <solo_un_tag>):

 <dbk:solo_un_tag> solo qualche parola </dbk:solo_un_tag>

Usando il sistema dei namespace, potete usare qualsiasi tag e qualsiasi attributo di qualsiasi DTD xml. Questro apre un mondo di possibilità, come vedrete nel prossimo capitolo...  

DTD disponibili

Questa è una piccola collezione di DTD che sono già (parzialmente) in uso.  

Link

Il W3C, o World Wide Web Consortium
Hanno informazioni su XML, MathML, CML, RDF, SVG, SOAP, XHTML, namespace...
www.w3.org

Alcune cose di Jaime Villate (Potreste aver bisogno di un traduttore online per leggere i primi due:)
Introduzione a XML(in Spagnolo)
Come generare HTML con XML(in Spagnolo)
LSM-slides

HTML tidy, il programma:
www.w3.org/People/Raggett/tidy

Docbook
www.docbook.org

Il progetto SVG di Mozilla
www.mozilla.org/projects/svg

Articoli correlati di LinuxFocus:
Usare XML e XSLT per costruire LinuxFocus.org(/Olanda)
Creare documenti PDF con DocBook


Webpages maintained by the LinuxFocus Editor team
© Floris Lambrechts
"some rights reserved" see linuxfocus.org/license/
http://www.LinuxFocus.org
Translation information:
en --> -- : Floris Lambrechts <floris/at/linuxfocus.org>
en --> it: AlessandroPellizzari <alex/at/neko.it>

2005-01-14, generated by lfparser_pdf version 2.51