Вступил в голландскую команду LF в 1999 г. и стал вторым редактором в начале этого года. Учится в Университете Неймегена на факультете информационной химии. Играет в баскетбол и любит путешествовать.
Содержание:
Заметка представляет собой введение в в использование Perl - модуля XML::XSLT. Рассматриваются возможности стандарта XSLT и способы их использования для управления документами XML.
XSLT рекомендован W3C и может рассматриваться как стандарт. XSLT является частью XSL(язык шаблонов XML). Его назначение, как следует из названия, - форматирование XML-документа. Форматирование является основной задачей XSL и в этом процессе часто необходима трансформация данных, что и осуществляет XSLT.
XSLT-обработчики написаны на нескольких языках программирования : на C(XT, разработан James Clark) и на Java(Xalan, разработан Lotus Inc.). Также существуют и Perl-проекты : XML::XSLT и XML::Sabotron. Первый полностью написан на Perl, второй являестся интерфейсом к C++ XSLT-обработчику.
Текущую версию модуля(0.21) можно загрузить с CPAN. Заметка основывается на данной версии. Perl-модуль был разработан Geert Josten - студентом факультета химии Университета Неймегена, но в настоящее время в разработке участвуют и многие другие. Применение CVS tree позволяет рассчитывать на ускорение разработки модуля, что необходимо W3C для осуществления рабочего проекта XSLT.
Ниже следует Perl-код, демонстрирующий использование модуля :
#!/usr/bin/perl use XML::XSLT; my $xmlfile = "example.xml"; my $xslfile = "example.xsl"; my $parser = XML::XSLT->new ($xslfile, "FILE"); $parser->transform_document ($xmlfile, "FILE"); $parser->print_result();
Здесь XML-файл(example.xml) трансформируется на основе XSLT-файла (example.xsl). Также шаблоны могут быть основаны на DOM tree :
#!/usr/bin/perl use XML::XSLT; use XML::DOM; my $domparser = new XML::DOM::Parser; my $doc = $domparser->parsefile ("file.xml"); my $parser = XML::XSLT->new ($doc, "DOM");
или строке :
#!/usr/bin/perl use XML::XSLT; my $xsl_string = qq{ <?xml version="1.0"?> <xsl:stylesheet> <xsl:template match="/"> <html> <xsl:apply-templates/> </body> </xsl:template> </xsl:stylesheet> }; my $parser = XML::XSLT->new ($xsl_string, "STRING");
Все три варианта можно использовать для процедуры transform_document(), показанной в первом примере.
Скрипт транслирующий XML-файл на основе шаблона XSLT можно загрузить здесь. Он использует имена файлов в качестве аргументов : шаблон XSLT и XML файл. Обратите внимание, что скрипт использует механизм "FILE".
Теперь, после того как мы узнали способ применения XSLT-обработчика для трансляции XML-документов в языке Perl, рассмотрим стандарт XSLT.
XSLT был разработан с целью упрощения публикации данных, хранимых в XML. XSL-форматирование используется для разработки и представления, а XSLT-для трансформации XML-данных (сортировка, выбор, комбинирование из различных источников). На самом деле, как показывает практика, XSLT достаточен также для разработки и представления.
Модуль XML::XSLT использует не все команды XSLT, но все рассматриваемые в заметке поддерживаются.
XSLT-документ определяет метод трансформации XML-документа. Это достигается определением шаблона для каждого элемента. Ниже рассматривается несколько примеров XSLT-документов, применяемых к одному XML-документу, содержащему рабочий лист Gnumeric (GNOME).
Просмотрев шаблоны можно обнаружить, что они содержат информацию о формате выводимых данных (например : формат страницы, ширина и высота ячейки). Мы создадим XSLT-шаблоны для выполнения следующих задач :
Введение в основы XML::XSLT осуществим написанием XSLT-шаблона выдающего краткий отчет (verysimple.xsl):
<?xml version="1.0"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:template match="*"> <xsl:apply-templates/> </xsl:template> <xsl:template match="text()"/> <xsl:template match="Item"> <xsl:value-of select="./name"/> : <xsl:value-of select="./val-string"/> </xsl:template> </xsl:stylesheet>
Первый шаблон находит все элементы в XML-документе, второй-CDATA в XML- документе и наконец третий выполняет то, что мы хотели сделать : каждый элемент в отчете сопровождается значением CDATA элементов name и val-string. Попробуйте сами! Сравните выводимую информацию с тем, что вы хотели получить.
Но ведь уже первый шаблон находит элемент, не так ли? Тогда почему применяется третий шаблон, а не первый? Все дело в том, что последующий переписывает предыдущий. Поэтому шаблоны расположены от общих к специфичным.
Обратите внимание на добавление множества пробелов. Я не думаю, что есть возможность обойти это для данной версии. Но если файл будет в формате XHTML- нам не о чем беспокоиться. Следующий пример соответствует предыдущему с добавлением служебной информации XHTML для просмотра выходного файла в веб - браузере (simple.xsl):
<?xml version="1.0"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:template match="*"> <xsl:apply-templates/> </xsl:template> <xsl:template match="text()"/> <xsl:template match="Item"> <b><xsl:value-of select="./name"/></b>: <i><xsl:value-of select="./val-string"/></i><br /> </xsl:template> <xsl:template match="/"> <html> <head> <title>Summary Gnumeric File</title> </head> <body bgcolor="white"> <xsl:apply-templates/> </body> </html> </xsl:template> </xsl:stylesheet>
Дополнительный шаблон для элемента root(/) позволяет вставить XHTML-код перед и после основного вывода. Рассмотрим подробнее : при запуске XML::XSLT осуществляется поиск шаблона с элементом root, далее вставляется XHTML-код до открывающего элемента <body> включительно, после этого применяются шаблоны к элементам, затем продолжается обработка с шаблоном root и вставляется закрывающий элемент </body> и др.
В шаблон Item добавляется дополнительный XHTML-код. Обратите внимание, что можно использовать одновременно и XSLT команды и выводимые данные. XSLT-обработчик принимает все элементы не содержащие xsl как выводимые данные.
С этого места будем показывать только новые или измененные шаблоны. Для завершения нашего первого примера добавим заголовок и посмотрим на результаты работы команды (finalsimple.xsl):
<xsl:template match="Summary"> <h2>Summary</h2> <ul> <xsl:apply-templates/> </ul> </xsl:template>
Команда xsl:for-each предоставляет дополнительные возможности обработки XML-документов, особенно в сочетании с командой xsl:sort, но она еще не включена в модуль XML::XSLT.
Добавим информацию о формате страниц Gnumeric Workbook с помощью xsl:for-each (foreach.xsl):
<xsl:template match="Sheets"> <xsl:for-each select="Sheet"> <h2><xsl:value-of select="Name"/></h2> <ul> Rows: <xsl:value-of select="MaxRow"/><br /> Cols: <xsl:value-of select="MaxCol"/><br /> </ul> </xsl:for-each> </xsl:template>
К сожалению использованный XML-документ состоит из одной страницы. Можно попробовать применить этот шаблон к другому Gnumeric-файлу, состоящему из нескольких страниц.
Как упоминалось раньше-мы не можем сортировать элементы с помощью XML::XSLT в данный момент. Очень жаль, потому что XML-данные в Gnumeric-файле не отсортированы. Если бы у нас была возможность отсортировать их, мы могли бы составить XHTML-таблицу с точным оглавлением. Все, что мы можем сейчас сделать - поместить всю информацию в одну колонку. Рассмотрим это в следующем примере.
Выведем информацию из третьей колонки (данные о зарплате состоятельных студентов из Голландии) с помощью команды xsl:if (if.xsl):
<xsl:template match="Sheets"> <xsl:for-each select="Sheet"> <h2><xsl:value-of select="Name"/></h2> <ul> Rows: <xsl:value-of select="MaxRow"/><br /> Cols: <xsl:value-of select="MaxCol"/><br /> <xsl:apply-templates select="Cells"/><br /> </ul> </xsl:for-each> </xsl:template> <xsl:template match="Cells"> Content of Col 3: <xsl:for-each select="Cell"> <xsl:if test="@Col='3'"> <xsl:value-of select="Content"/><xsl:text>, </xsl:text> </xsl:if> </xsl:for-each> </xsl:template>
Так как сам шаблон "Sheets" не применяет никаких дополнительных
шаблонов к элементу "Cell" нам необходимо указать это. Используя
команду xsl:apply-templates
с аттрибутом "Cells" мы
применяем шаблон к этому элементу.
Шаблон "Cells" просматривает все элементы "Cell" (будьте внимательны и проверьте это с исходным XML-файлом), но выводит значение только если аттрибут "Col" имеет значение "3". Обратите внимание, что наличие "@" указывает на аттрибут, а отсутствие - на элемент.
Разработанные нами шаблоны стали более сложными и теперь надо контролировать
текущий элемент. В рамках всего документа это невозможно, но можно попытаться
в отдельном шаблоне. Например, обращаясь к шаблону "Cells" обработчик
проводит поиск этого элемента (в данном случае элемент "Cells").
Далее select="Cell"
в команде xsl:for-each
производит
выборку всех элементов "Cell", и один раз в этом цикле будет
обращение к одному из элементов. Обратите внимание, что test="@Col"
обращается к аттрибуту "Cell", а не "Cells". К аттрибуту
"Cells" можно обратиться - select="../@name"
,
даже если "Cells" не имеет аттрибутов.
Команда xsl:text контролирует вывод всего текста. Пробел в последовательности
", "
принимается как не относящийся к выводимой
информации.
Эта заметка является лишь введением в использование модуля XML::XSLT. Возможно у вас возникнут вопросы и это хорошо. Оставляйте их на контактной странице или пишите в лист рассылки веб сайта XML::XSLT.
Webpages maintained by the LinuxFocus Editor team
© Egon Willighagen LinuxFocus.org 2000 Click here to report a fault or send a comment to Linuxfocus |
Translation information:
|
2000-07-04, generated by lfparser version 1.5