Обзор XML

Обзор XML

Язык XML предназначен только для работы с данными. Точнее говоря, он предназначен для создания набора сведений, или метаданных, которые описывают данные. Рассмотрим приведенный ниже простой фрагмент кода на языке HTML.

<form name="frmMain" action="mypage.aspx" method="POST">

</form>

Этот фрагмент содержит определение элемента form с атрибутами name, action и method. Атрибуты описывают отдельные элементы формы, сообщают Web-броузеру о выполняемых с ней действиях и являются простейшим примером метаданных. Обратите внимание на замыкающий дескриптор </form>, который обозначает конец контейнера элементов формы. В данном примере form – это универсальный контейнер с универсальными элементами. Экземпляр контейнера form образуется при размещении данных в его структуре.

В приведенном ниже коде показан способ использования элементов и атрибутов XML для описания конкретного фрагмента данных. В нем создается профиль пользователя, который сохраняется в виде узла. Узел (или элемент) Person содержит атрибуты, которые описывают данного пользователя.

<Person firstName="John" lastName="Doe" address1="123 Main Street" address2="" city="Sometown" state="OH" zip="22222" phone="111-242-5512" />

Обратите внимание, что вся информация, независимо от конкретного пользователя, хранится в элементе Person. Любое приложение, которое может анализировать данные в формате XML (а это подвластно практически любому современному коммерческому приложению для работы с данными), способно извлечь из этого кода сведения о пользователе: имя, фамилию, адрес и номер телефона. Кроме того, поскольку с этим пользователем никакие другие данные не связаны, все сведения заканчиваются замыкающим дескриптором </Person>. В формате XML к синтаксису предъявляются очень строгие требования, например если не указать замыкающий дескриптор или пропустить какой-то элемент, то чтение всего документа может закончиться неудачей.

НА ЗАМЕТКУ

Семантика XML интересна тем, что на элемент можно ссылаться как на узел и наоборот. В некоторых публикациях элемент также называют дескриптором. Во избежание путаницы здесь и далее используются только термины "элемент" и"узел". 

Элементы не только могут иметь атрибуты, но и подчиненные элементы; аналогично, подчиненные элементы могут иметь свои собственные атрибуты, как показано в листинге 9.1.

Листинг 9.1. Пример элемента Person с подчиненными элементами

<Person firstName="John">

 lastName = "Doe"

 address1 = "123 Main Street"

 address2 = ""

 city = "Sometown"

 state = "ОН"

 zip = "22222"

 phone = "111-242=5512"

 <orders>

  <order id="111" itemid="2932" itemdesc="Super Foo Widget"></order>

 </orders>

</Person>

Как видите, элемент Person здесь нужно закрыть явно, потому что изменился диапазон контейнера, т.е. теперь он содержит сведения о заказах orders. Приведенный в листинге 9.1 код является нейтральным, т.е. не содержит никакой информации о приложении, только данные и метаданные.

НА ЗАМЕТКУ

Языку XML посвящено множество материалов, опубликованных в печатных изданиях и в Internet. Прекрасное введение в XML можно найти по адресу: http://www/w3.org/XML/1999/XML-in-10-points.html. Вот несколько других адресов Web-узлов, которые содержат наиболее полные сведения по этой теме:

• Web-узел консорциума World Wide Web Consortium http://www/w3.org) содержит официальные и хорошо документированные спецификации XML;

• Web-узел компании Microsoft (http://msdn.microsoft.com) содержит постоянно обновляемые ресурсы, которые охватывают все вопросы использования XML и родственных технологий с программными продуктами Microsoft;

• Web-узел компании TopXML/VBXML.com (http://www.vbxml.com) предлагает разные ресурсы и примеры кодов для работы с технологией XML.