Introducción al lenguaje XML
De SGML a XML
La gran preocupación de SGML (Standard Generalized Markup Language) en la década de 1980 era la de separar el contenido de un documento de su formato. Sin embargo, los documentos así creados estaban destinados a imprimirse. Gracias a este concepto, un documento (que contiene los datos) se podría imprimir en varios formatos. SGML era tan complejo que las manipulaciones solo podían llevarse a cabo por especialistas (en general, redactores técnicos).
Poco a poco se democratiza la documentación online, introduciendo al mismo tiempo el principio del hipervínculo.
Desde 1992, gracias a la llegada de la Web y del lenguaje HTML (HyperText Markup Language), los documentos electrónicos de hipertexto se han publicado de manera extensa. Por otra parte, la disponibilidad de motores de búsqueda ha demostrado la eficacia de la aplicación de tales documentos.
Por consiguiente, el SGML era demasiado complejo y por lo tanto no apto para la Web, y el HTML no era muy escalable. El W3C naturalmente quería diseñar un lenguaje que poseyera la facilidad de implementación del HTML y la riqueza semántica del SGML. Así nació el XML.
Los conceptos básicos del XML
1. Recordatorio sobre el HTML
A diferencia del HTML, el XML no está limitado por un etiquetado predefinido. Dentro de un documento XML, tiene total libertad para definir sus propias etiquetas.
Recordemos que un documento HTML es un documento de texto compuesto de parejas de "etiqueta de apertura/etiqueta de cierre" que describen una función en la organización del documento. Los documentos HTML se pueden editar con un simple editor de texto y se interpretan por los navegadores web.
Las siguientes líneas describen un documento HTML muy simple que presenta un texto en negrita en la ventana del navegador (la pantalla siguiente presenta la ejecución del documento en un navegador web).
<HTML>
<HEAD>
<TITLE>La página HTML más sencilla</TITLE>
</HEAD>
<BODY>
<B> Una página HTML sencilla </B>
</BODY>
</HTML>
Ejecución del documento HTML en un navegador web
2. Creación de un primer documento XML
En un documento XML puede crear sus propias etiquetas de descripción.
<nombreapellido>Mitch Mitchell</nombreapellido>
Esta línea es sintácticamente correcta en XML, pero no se puede utilizar en un documento HTML.
Los bloques creados pueden contener nuevos bloques...
La sintaxis XML
Un archivo XML es un archivo de texto especial compuesto por un determinado número de etiquetas en estructura de árbol. Los elementos del árbol están todos vinculados entre ellos a través de las ramas que se crean.
No tendrá ninguna dificultad en diseñar documentos XML si ya conoce el lenguaje HTML. Sin embargo, tenga en cuenta que en XML todas las etiquetas que se abran deben cerrarse.
A diferencia de HTML, en XML cualquier etiqueta abierta debe cerrarse.
De hecho, este lenguaje implica un mayor rigor en la escritura del código. Los navegadores están diseñados de tal manera que incluso un desarrollador HTML poco aplicado puede escribir páginas HTML. Los navegadores han implementado grandes módulos de gestión de errores que ralentizan considerablemente la ejecución (la presentación) de páginas HTML. Si prueba el siguiente ejemplo en un navegador, verá el siguiente error en su pantalla.
<?xml version="1.0"?>
<A>
<B>Entre dos etiquetas</B>
<C>Falta la etiqueta de cierre
</A>
Error generado por olvidar una etiqueta de cierre
El archivo XML está organizado según varios componentes que pueden representarse en la forma de un árbol. Por ejemplo, el siguiente esquema enumera todos estos componentes. Las siguientes secciones presentan con más detalle las funciones de estos últimos.
Los componentes de un documento XML
1. La primera línea del documento XML
a. Declaración XML
La primera línea de un documento XML es el prólogo y contiene, entre otras cosas, la declaración de la versión de XML utilizada para la descripción de la información. Esta declaración tiene el siguiente formato:
<?xml version="1.0" ?>
b. Codificación de caracteres
El prólogo también permite especificar el estándar de codificación de los caracteres utilizados en el documento. La escritura de los caracteres XML cumple con la norma UNICODE, desarrollada para facilitar la internacionalización de los archivos. Todos los archivos XML presentados en este manual cumplen con la norma ISO 8859-1 correspondiente a la codificación de caracteres para los idiomas de Europa occidental (Latin-1)....