Обработка пробельных символов

Обработка пробельных символов

В XSLT выделяются четыре пробельных символа, обработка которых несколько отличается от обработки других символов. Их Unicode-коды и описания сведены в табл. 8.1.

Таблица 8.1. Unicode-коды пробельных символов

Unicode-коды Описание Десятичный Шестнадцатеричный #9 #x9 Горизонтальная табуляция #10 #xA Перевод строки #13 #xD Возврат каретки #32 #x20 Пробел

Отличие обработки пробельных символов заключается в том, что после разбора и создания логической модели для входящего документа и для самого преобразования, узлы, которые содержат только пробельные символы, будут удалены из дерева.

Пример

Рассмотрим шаблон преобразования, содержащий пробельные символы ("?" обозначает пробел, а "¶" — перевод строки).

Листинг 8.1. Шаблон преобразования с пробельными символами

<xsl:template match="/">¶

???<a>¶

???¶

?????????<b/>¶

??????¶

?????????</a>¶

</xsl:template>

Поскольку текстовые узлы этого шаблона содержат только пробельные символы, они будут удалены из дерева преобразования, и результат будет иметь вид:

<a><b/></a>

Вообще, текстовый узел будет сохранен при выполнении хотя бы одного из следующих условий.

? Он содержит хотя бы один непробельный символ.

? Он принадлежит элементу, в котором сохранение пробельных символов задано средствами XML, а именно атрибутом xml:space со значением preserve.

? Он принадлежит элементу, имя которого включено во множество имен элементов, для которых нужно сохранять пробельные символы.

Во всех остальных случаях текстовый узел будет удален.

Продемонстрируем все три случая сохранения текстового узла на примерах.

Первый случай довольно прост. Шаблон

<xsl:template match="/">¶

??<a/>¶

</xsl:template>

создаст в выходящем документе фрагмент

<а/>

безо всяких пробельных символов, в то время как шаблон

<xsl:template match="/">¶

??|<a/>|¶

</xsl:template>

создаст фрагмент вида

??|<a/>|¶

Различие двух этих шаблонов в том, что в первом текстовые узлы содержат текст "¶ ¶ ??" и "¶ ¶ " соответственно, а во втором — "¶ ¶ ??|" и "| ¶ ¶". Текстовые узлы второго шаблона не будут удалены, поскольку они содержат непробельные символы (символы "|").

Второй случай сохранения текстовых узлов основан на использовании возможностей XML по управлению пробельными символами. Если в элементе задан атрибут xml:space со значением "preserve", обрабатывающее программное обеспечение должно сохранять в нем и в его потомках пробельные символы. Единственным исключением из этого правила может быть опять же атрибут xml:space, заданный в элементе-потомке со значением "default".

Пример

Шаблон

<xsl:template match="/">¶

??<а>¶

????<b>¶

??????<c>¶

????????<d/>¶

??????</c>¶

????</b>¶

??</a>¶

</xsl:template>

создаст в выходящем документе фрагмент вида:

<a><b><c><d/></c></b></a>

Если же шаблон будет определен в виде:

<xsl:template match="/">¶

??<а xml:space="preserve">¶

????<b>¶

??????<c xml:space="default">¶

????????<d/>¶

??????</c>¶

????</b>¶

??</a>¶

</xsl:template>

то в выходящем фрагменте в элементах а и b пробельные символы будут сохранены, а в элементах с и d — удалены:

<а xml:space="preserve">¶

????<b>¶

??????<c xml: space="default"><d/></c>¶

????</b>¶

??</а>

В третьем случае сохранение пробельных символов текстового узла зависит от того, принадлежит ли имя родительского элемента особому множеству, называемому множеством имен элементов, для которых следует сохранять пробельные символы или, для краткости, сохраняющее множество.

Для преобразований сохраняющее множество состоит из единственного элемента xsl:text, то есть единственный элемент в преобразовании, для которого пробельные текстовые узлы не будут удаляться, — это элемент xsl:text. Поэтому его часто используют для вывода в выходящем документе пробельных символов.

Для входящих документов сохраняющее множество состоит из имен всех элементов. То есть по умолчанию преобразования сохраняют все пробельные текстовые узлы. Для изменения сохраняющего множества элементов входящего документа используются элементы xsl:preserve-space и xsl:strip-space.