Что такое код xslt_set_sax_handler

Чтение XML файла средствами SAX XML

В отличие от DOM парсера, SAX парсер не читает весь XML файл, не загружает его полностью в оперативную память и не создает полную объектную модель читаемого XML документа. Вместо этого, SAX парсер информирует клиентский код о структуре читаемого XML документ, вызывая методы класса org.xml.sax.helpers.DefaultHandler .

SAX парсер работает намного быстрее и использует гораздо меньше памяти, чем DOM XML парсер.

Для того, чтобы сообщить клиентскому коду структуру и содержание XML документа, SAX парсер использует следующие методы:

  • startDocument() и endDocument() — методы, которые вызываются в начале и конце XML документа соответственно;
  • startElement() и endElement() — методы, которые вызываются в начале и в конце XML элемента, соответственно;
  • characters() — метод, который вызывается для текста, расположенного между открывающим и закрывающим тегами XML элемента.

На самом деле, в классе определено гораздо больше методов, но в данной статье они не представляют для нас интереса. Для получения информации о них обратитесь к документации.

Мы рассмотрим простой пример использования этих методов для получения структуры XML файла.

Что такое код xslt_set_sax_handler

(только 4.0.3 — 4.0.6)

xslt_set_sax_handler — устанавливает SAX-обработчики для XSLT-процессора.

Описание

void xslt_set_sax_handler (resource xh, array handlers)

Устанавливает SAX-обработчики в данном дескрипторе ресурса xh . SAX-обработчики должны быть двухмерным массивом в формате (все элементы верхнего уровня являются необязательными):


Назад Оглавление Вперёд
xslt_set_log Вверх xslt_set_sax_handlers

© 2006-2012 Веб-мастер Борисов Виктор Александрович

xslt_set_sax_handlers

Set the SAX handlers to be called when the XML document gets processed ( PHP 4 >= 4.0.6 )

xslt_set_sax_handlers() registers the SAX handlers for the document, given a XSLT processor resource.

Using xslt_set_sax_handlers() doesn’t look very different than running a SAX parser like xml_parse() on the result of an xslt_process() transformation.

Parameters

handlers should be an array in the following format:

«document» => array(
«start_doc» ,
«end_doc» ),

«element» => array(
«start_element» ,
«end_element» ),

«namespace» => array(
«start_namespace» ,
«end_namespace» ),

Where the functions follow the syntax described for the scheme handler functions.

The given array does not need to contain all of the different sax handler elements (although it can), but it only needs to conform to «handler» => «function» format described above.

Each of the individual SAX handler functions are in the format below:

Return Values

No value is returned.

Examples

Example 2668. xslt_set_sax_handlers() Example

// From ohlesbeauxjours at yahoo dot fr
// Here’s a simple example that applies strtoupper() on
// the content of every tag and then displays the
// resulting XML tree:

// Handlers :
function start_document ()
<
// start reading the document
>

function end_document ()
<
// end reading the document
>

function start_element ( $parser , $name , $attributes )
<
global $result , $tag ;
$result .= » . $name . «>» ;
$tag = $name ;
>

function end_element ( $parser , $name )
<
global $result ;
$result .= » . $name . «>» ;
>

function characters ( $parser , $data )
<
global $result , $tag ;
if ( $tag == «auteur» ) <
$data = strtoupper ( $data );
>
$result .= $data ;
>

// Transformation :
$xh = xslt_create ();
$handlers = array( «document» => array( «start_document» , «end_document» ),
«element» => array( «start_element» , «end_element» ),
«character» => «characters» );

xslt_set_sax_handlers ( $xh , $handlers );
xslt_process ( $xh , ‘arg:/_xml’ , ‘arg:/_xsl’ , NULL , array( «/_xml» => $xml , «/_xsl» => $xsl ));
xslt_free ( $xh );
?>

You can also use xslt_set_object() if you want to implement your handlers in an object.

Example 2669. Object oriented handler

// This is the object oriented version of the previous example
class data_sax_handler <

var $buffer , $tag , $attrs ;

function data_sax_handler ( $xml , $xsl )
<
// our xslt resource
$this -> _xh = xslt_create ();

xslt_set_object ( $this -> _xs , $this );

// configure sax handlers
$handlers = array(
«document» => array( ‘start_document’ , ‘end_document’ ),
«element» => array( ‘start_element’ , ‘end_element’ ),
«character» => ‘characters’
);

xslt_set_sax_handlers ( $this -> _xh , $handlers );

xslt_process ( $this -> _xh , ‘arg:/_xml’ , ‘arg:/_xsl’ , NULL , array( «/_xml» => $xml , «/_xsl» => $xsl ));
xslt_free ( $this -> _xh );

function start_document ()
<
// start reading the document
>

function end_document () <
// complete reading the document
>

function start_element ( $parser , $name , $attributes ) <
$this -> tag = $name ;
$this -> buffer .= » . $name . «>» ;
$this -> attrs = $attributes ;
>

function end_element ( $parser , $name )
<
$this -> tag = » ;
$this -> buffer .= » . $name . «>» ;
>

function characters ( $parser , $data )
<
if ( $this -> tag == ‘auteur’ ) <
$data = strtoupper ( $data );
>
$this -> buffer .= $data ;
>

function get_buffer () <
return $this -> buffer ;
>

$exec = new data_sax_handler ( $xml , $xsl );

Чтение документов XML при помощи интерфейса SAX

Чтение документов XML при помощи интерфейса SAX

SAX является фактическим стандартом программного интерфейса с открытым исходным кодом, который обеспечивает чтение документов XML.

Классы Qt для интерфейса SAX моделируют реализацию SAX2 Java с некоторыми отличиями в названиях для обеспечения принятых в Qt правил обозначений названий классов и их членов. Более подробную информацию относительно SAX можно получить в сети Интернет по адресу http://www.saxproject.org/.

Qt обеспечивает построенный на основе интерфейса SAX парсер документов XML, не предусматривающий проверку их достоверности под названием QXmlSimpleReader. Этот парсер распознает хорошо сформированные документы XML и поддерживает пространства имен XML. Когда парсер обрабатывает документ, он вызывает виртуальные функции в зарегистрированных классах—обработчиках, уведомляющих о возникновении соответствующих событий в ходе синтаксического анализа документа. (Эти события никак не связаны с такими событиями Qt, как события клавиатуры и события мышки.) Например, пусть парсер выполняет анализ следующего документа XML:

Ars longa vita brevis

В этом случае парсер вызовет следующие обработчики событий синтаксического анализа:

characters(«Ars longa vita brevis»)

Все приведенные выше функции объявлены в классе QXmlContentHandler. Для простоты мы не стали указывать некоторые аргументы функций startElement() и endElement().

QXmlContentHandler — это всего лишь один из многих классов—обработчиков, которые могут использоваться совместно с классом QXmlSimpleReader. Другими такими классами являются QXmlEntityResolver, QXmlDTDHandler, QXmlErrorHandler, QXmlDeclHandler и QXmlLexicalHandler. Эти классы только объявляют чистые виртуальные функции и предоставляют информацию о различных событиях синтаксического анализа. Для большинства приложений вполне достаточно использовать лишь классы QXmlContentHandler и QXmlErrorHandler.

Для удобства Qt также предоставляет класс QXmlDefaultHandler, который наследует все классы—обработчики и обеспечивает очень простую реализацию всех функций. Такая конструкция со множеством абстрактных классов—обработчиков и одним подклассом с тривиальной реализацией функций необычна для Qt; она принята для максимального соответствия модели Java—реализации.

Теперь мы рассмотрим пример, который показывает способы применения QXmlSimpleReader и QXmlDefaultHandler для синтаксического анализа файла XML заранее известного формата и для отображения его содержимого в виджете QTreeWidget. Подкласс QXmlDefaultHandler имеет название SaxHandler, и он используется для обработки предметного указателя книги, который содержит элементы и подэлементы.

Рис. 15.1. Дерево наследования для SaxHandler.

Ниже приводится файл предметного указателя книги, который отображается в виджете QTreeWidget и показан на рис. 15.2:

Рис. 15.2. Файл предметного указателя книги, загруженный в виджет QTreeWidget.

Первый этап в реализации парсера заключается в создании подкласса QXmlDefaultHandler:

01 class SaxHandler : public QXmlDefaultHandler

04 SaxHandler(QTreeWidget *tree);

05 bool startElement(const QString &namespaceURI,

06 const QString &localName,

07 const QString &qName,

08 const QXmlAttributes &attributes);

09 bool endElement(const QString &namespaceURI,

10 const QString &localName,

11 const QString &qName);

12 bool characters(const QString &str);

13 bool fatalError(const QXmlParseException &exception);

15 QTreeWidget *treeWidget;

16 QTreeWidgetItem *currentItem;

17 QString currentText;

Класс SaxHandler наследует QXmlDefaultHandler и переопределяет четыре функции: startElement(), endElement(), characters() и fatalError(). Первые четыре функции объявлены в QXmlContentHandler; последняя функция объявлена в QXmlErrorHandler.

01 SaxHandler::SaxHandler(QTreeWidget *tree)

04 currentItem = 0;

Конструктор SaxHandler принимает объект типа QTreeWidget, который мы собираемся заполнять информацией, содержащейся в файле XML.

01 bool SaxHandler::startElement(const QString & /* namespaceURI */,

02 const QString & /* localName */,

03 const QString &qName,

04 const QXmlAttributes &attributes)

06 if (qName == «entry») <

07 if (currentItem) <

08 currentItem = new QTreeWidgetItem(currentItem);

10 currentItem = new QTreeWidgetItem(treeWidget);

12 currentItem->setText(0, attributes.value(«term»));

13 > else if (qName == «page») <

Функция startElement() вызывается, когда обнаруживается новый открывающий тег. Третий параметр представляет собой имя тега (или точнее — «подходящее имя»). В четвертом параметре задается список атрибутов. В этом примере мы игнорируем первый и второй параметры. Они полезны для тех файлов XML, которые используют механизм пространств имен, подробно описанный в справочной документации.

Если обнаружен тег , мы создаем новый элемент списка QTreeWidget. Если данный тег является вложенным в другой тег , новый тег определяет подэлемент предметного указателя, и новый элемент QTreeWidgetItem создается как дочерний по отношению к внешнему элементу QTreeWidgetItem. В противном случае мы создаем элемент QTreeWidgetItem, используя в качестве родительского элемента объект treeWidget, делая его элементом верхнего уровня. Мы вызываем функцию setText() для отображения в столбце 0 текста со значением атрибута term тега .

Если обнаружен тег

, мы устанавливаем значение переменной currentText на пустую строку. В переменной currentText накапливается текст, расположенный между тегами

В конце мы возвращаем true, указывая SAX на необходимость продолжения синтаксического анализа файла. Если бы нам нужно было сообщить об ошибке из-за обнаружения неизвестного тега, мы возвращали бы в этих случаях false. Нам также потребовалось бы переопределить функцию errorString() класса QXmlDefaultHandler для возврата соответствующего сообщения об ошибке.

01 bool SaxHandler::characters(const QString &str)

03 currentText += str;

Функция characters() используется для извлечения символьных данных из документа XML. Мы просто добавляем символы в конец переменной currentText.

01 bool SaxHandler::endElement(const QString & /* namespaceURI */,

02 const QString & /* localName */, const QString &qName)

04 if (qName == «entry») <

05 currentItem = currentItem->parent();

06 > else if (qName == «page») <

07 if (currentItem) <

08 QString allPages = currentItem->text(1);

09 if (!allPages.isEmpty())

11 allPages += currentText;

12 currentItem->setText(1, allPages);

Функция endElement() вызывается при обнаружении закрывающего тега. Так же как и для функции startElement(), ее третий параметр содержит имя тега.

Если обнаружен тег , мы устанавливаем закрытую переменную currentItem на родительский элемент текущего элемента QTreeWidgetItem. Это обеспечивает восстановление переменной currentItem на значение, которое она имела перед чтением соответствующего тега .

Если обнаружен тег

, мы добавляем указанный номер страницы или диапазон страниц в разделяемый запятыми список в столбце 1 текущего элемента.

01 bool SaxHandler::fatalError(const QXmlParseException &exception)

03 QMessageBox::warning(0, QObject::tr(«SAX Handler»),

04 QObject::tr(«Parse error at line %1, column %2: %3.»)

08 return false;

Функция fatalError() вызывается, когда синтаксический анализ файла XML завершается неудачей. В этом случае мы просто выводим на экран сообщение, указывая номер строки, номер столбца и текст об ошибке синтаксического анализа.

Этим мы завершаем реализацию класса SaxHandler. Теперь давайте посмотрим, как можно использовать этот класс:

01 bool parseFile(const QString &fileName)

03 QStringList labels;

07 treeWidget->setWindowTitle(QObject::tr(«SAX Handler»));

09 QFile file(fileName);

10 QXmlInputSource inputSource(&file);

11 QXmlSimpleReader reader;

12 SaxHandler handler(treeWidget);

15 return reader.parse(inputSource);

Мы задаем два столбца в виджете QTreeWidget. Затем мы создаем объект типа QFile для считываемого файла и объект типа QXmlSimpleReader для синтаксического анализа файла. Нам не требуется самим открывать QFile; QXmlInputSource делает это автоматически.

Наконец, мы создаем объект типа SaxHandler, который используется для объекта reader одновременно в качестве обработчика содержимого файла и обработчика ошибок, и мы вызываем функцию parse() для выполнения синтаксического анализа.

Вместо простого объекта файла мы передаем функции parse() объект QXmlInputSource. Этот класс открывает заданный файл, читает его (учитывая кодировку символов в объявлении ) и предоставляет интерфейс для чтения файла парсером.

В классе SaxHandler мы всего лишь переопределили функции, унаследованные от классов QXmlContentHandler и QXmlErrorHandler. Если бы мы стали переопределять функции других классов—обработчиков, нам пришлось бы вызывать соответствующие функции—установщики для объекта reader.

Для сборки приложения с библиотекой QtXml в файл .pro необходимо добавить следующую строку:

19.12. xml.sax.handler — Base >

New in version 2.0.

This is the main callback interface in SAX, and the one most important to applications. The order of events in this interface mirrors the order of the information in the document.

Handle DTD events.

This interface specifies only those DTD events required for basic parsing (unparsed entities and attributes).

Basic interface for resolving entities. If you create an object implementing this interface, then register the object with your Parser, the parser will call the method in your object to resolve all external entities.

Interface used by the parser to present error and warning messages to the application. The methods of this object control whether errors are immediately converted to exceptions or are handled in some other way.

In addition to these > xml.sax.handler provides symbolic constants for the feature and property names.

List of all features.

List of all known property names.

19.12.1. ContentHandler Objects¶

Users are expected to sub > ContentHandler to support their application. The following methods are called by the parser on the appropriate events in the input document:

ContentHandler. setDocumentLocator ( locator ) В¶

Called by the parser to give the application a locator for locating the origin of document events.

SAX parsers are strongly encouraged (though not absolutely required) to supply a locator: if it does so, it must supply the locator to the application by invoking this method before invoking any of the other methods in the DocumentHandler interface.

The locator allows the application to determine the end position of any document-related event, even if the parser is not reporting an error. Typically, the application will use this information for reporting its own errors (such as character content that does not match an application’s business rules). The information returned by the locator is probably not sufficient for use with a search engine.

Note that the locator will return correct information only during the invocation of the events in this interface. The application should not attempt to use it at any other time.

Receive notification of the beginning of a document.

The SAX parser will invoke this method only once, before any other methods in this interface or in DTDHandler (except for setDocumentLocator() ).

Receive notification of the end of a document.

The SAX parser will invoke this method only once, and it will be the last method invoked during the parse. The parser shall not invoke this method until it has either abandoned parsing (because of an unrecoverable error) or reached the end of input.

ContentHandler. startPrefixMapping ( prefix, uri ) В¶

Begin the scope of a prefix-URI Namespace mapping.

The information from this event is not necessary for normal Namespace processing: the SAX XML reader will automatically replace prefixes for element and attribute names when the feature_namespaces feature is enabled (the default).

There are cases, however, when applications need to use prefixes in character data or in attribute values, where they cannot safely be expanded automatically; the startPrefixMapping() and endPrefixMapping() events supply the information to the application to expand prefixes in those contexts itself, if necessary.

Note that startPrefixMapping() and endPrefixMapping() events are not guaranteed to be properly nested relative to each-other: all startPrefixMapping() events will occur before the corresponding startElement() event, and all endPrefixMapping() events will occur after the corresponding endElement() event, but their order is not guaranteed.

ContentHandler. endPrefixMapping ( prefix ) В¶

End the scope of a prefix-URI mapping.

See startPrefixMapping() for details. This event will always occur after the corresponding endElement() event, but the order of endPrefixMapping() events is not otherwise guaranteed.

ContentHandler. startElement ( name, attrs ) В¶

Signals the start of an element in non-namespace mode.

The name parameter contains the raw XML 1.0 name of the element type as a string and the attrs parameter holds an object of the Attributes interface (see The Attributes Interface ) containing the attributes of the element. The object passed as attrs may be re-used by the parser; holding on to a reference to it is not a reliable way to keep a copy of the attributes. To keep a copy of the attributes, use the copy() method of the attrs object.

ContentHandler. endElement ( name ) В¶

Signals the end of an element in non-namespace mode.

The name parameter contains the name of the element type, just as with the startElement() event.

ContentHandler. startElementNS ( name, qname, attrs ) В¶

Signals the start of an element in namespace mode.

The name parameter contains the name of the element type as a (uri, localname) tuple, the qname parameter contains the raw XML 1.0 name used in the source document, and the attrs parameter holds an instance of the AttributesNS interface (see The AttributesNS Interface ) containing the attributes of the element. If no namespace is associated with the element, the uri component of name will be None . The object passed as attrs may be re-used by the parser; holding on to a reference to it is not a reliable way to keep a copy of the attributes. To keep a copy of the attributes, use the copy() method of the attrs object.

Parsers may set the qname parameter to None , unless the feature_namespace_prefixes feature is activated.

ContentHandler. endElementNS ( name, qname ) В¶

Signals the end of an element in namespace mode.

The name parameter contains the name of the element type, just as with the startElementNS() method, likewise the qname parameter.

ContentHandler. characters ( content ) В¶

Receive notification of character data.

The Parser will call this method to report each chunk of character data. SAX parsers may return all contiguous character data in a single chunk, or they may split it into several chunks; however, all of the characters in any single event must come from the same external entity so that the Locator provides useful information.

content may be a Unicode string or a byte string; the expat reader module produces always Unicode strings.

The earlier SAX 1 interface provided by the Python XML Special Interest Group used a more Java-like interface for this method. Since most parsers used from Python did not take advantage of the older interface, the simpler signature was chosen to replace it. To convert old code to the new interface, use content instead of slicing content with the old offset and length parameters.

Receive notification of ignorable whitespace in element content.

Validating Parsers must use this method to report each chunk of ignorable whitespace (see the W3C XML 1.0 recommendation, section 2.10): non-validating parsers may also use this method if they are capable of parsing and using content models.

SAX parsers may return all contiguous whitespace in a single chunk, or they may split it into several chunks; however, all of the characters in any single event must come from the same external entity, so that the Locator provides useful information.

ContentHandler. processingInstruction ( target, data ) В¶

Receive notification of a processing instruction.

The Parser will invoke this method once for each processing instruction found: note that processing instructions may occur before or after the main document element.

A SAX parser should never report an XML declaration (XML 1.0, section 2.8) or a text declaration (XML 1.0, section 4.3.1) using this method.

ContentHandler. skippedEntity ( name ) В¶

Receive notification of a skipped entity.

The Parser will invoke this method once for each entity skipped. Non-val > feature_external_ges and the feature_external_pes properties.

19.12.2. DTDHandler Objects¶

DTDHandler instances provide the following methods:

DTDHandler. notationDecl ( name, public >) В¶

Handle a notation declaration event.

DTDHandler. unparsedEntityDecl ( name, public >) В¶

Handle an unparsed entity declaration event.

19.12.3. EntityResolver Objects¶

Resolve the system identifier of an entity and return either the system identifier to read from as a string, or an InputSource to read from. The default implementation returns systemId.

19.12.4. ErrorHandler Objects¶

Objects with this interface are used to receive error and warning information from the XMLReader . If you create an object that implements this interface, then register the object with your XMLReader , the parser will call the methods in your object to report all warnings and errors. There are three levels of errors available: warnings, (possibly) recoverable errors, and unrecoverable errors. All methods take a SAXParseException as the only parameter. Errors and warnings may be converted to an exception by raising the passed-in exception object.

ErrorHandler. error ( exception ) В¶

Called when the parser encounters a recoverable error. If this method does not raise an exception, parsing may continue, but further document information should not be expected by the application. Allowing the parser to continue may allow additional errors to be discovered in the input document.

ErrorHandler. fatalError ( exception ) В¶

Called when the parser encounters an error it cannot recover from; parsing is expected to terminate when this method returns.

ErrorHandler. warning ( exception ) В¶

Called when the parser presents minor warning information to the application. Parsing is expected to continue when this method returns, and document information will continue to be passed to the application. Raising an exception in this method will cause parsing to end.

Что такое код xslt_set_sax_handler

xslt_set_sax_handler — Set SAX handlers for a XSLT processor

Description vo >xslt_set_sax_handler ( resource xh, array handlers)

Set SAX handlers on the resource handle given by xh . SAX handlers should be a two dimensional array with the format (all top level elements are optional):

array( [document] => array( start document handler, end document handler ), [element] => array( start element handler, end element handler ), [namespace] => array( start namespace handler, end namespace handler ), [comment] => comment handler, [pi] => processing instruction handler, [character] => character data handler )

Чтение XML файла средствами SAX XML

В отличие от DOM парсера, SAX парсер не читает весь XML файл, не загружает его полностью в оперативную память и не создает полную объектную модель читаемого XML документа. Вместо этого, SAX парсер информирует клиентский код о структуре читаемого XML документ, вызывая методы класса org.xml.sax.helpers.DefaultHandler .

SAX парсер работает намного быстрее и использует гораздо меньше памяти, чем DOM XML парсер.

Для того, чтобы сообщить клиентскому коду структуру и содержание XML документа, SAX парсер использует следующие методы:

  • startDocument() и endDocument() — методы, которые вызываются в начале и конце XML документа соответственно;
  • startElement() и endElement() — методы, которые вызываются в начале и в конце XML элемента, соответственно;
  • characters() — метод, который вызывается для текста, расположенного между открывающим и закрывающим тегами XML элемента.

На самом деле, в классе определено гораздо больше методов, но в данной статье они не представляют для нас интереса. Для получения информации о них обратитесь к документации.

Мы рассмотрим простой пример использования этих методов для получения структуры XML файла.

SavePearlHarbor

Ещё одна копия хабора

JAXB и XSLT с использованием StAX

В моем случае DOM отпал по причине потребляемой памяти. SAX API построено на handler’ах, в результате код получается менее читабельным. StAX представляет из себя потоковый парсер (как и SAX), но API построено на принципе pull. То есть распознанные элементы «вынимаются» из потока по требованию.

Поскольку структуры данных подпадающие под обработку были весьма сложными и разнообразными, а обработка достаточно нетривиальная, решено было использовать JAXB для перевода во внутреннее представление.

Данные проекта закрыты NDA, поэтому в статье не используются.

И так, есть следующий

из него нужно выделить и обработать тэги dtype_one, dtype_two и dtype_three. Тэги повторяются в документе. Берем

и убеждаемся что в нем есть элементы «element» нужных нам тэгов:

если схемы нет, IDEA отлично может сгенерить ее по xml файлу.

Это нужно для того, что бы XJC сгенерил аннотацию @XmlRootElement. Проект собирается maven, для вызова XJC используется maven-jaxb2-plugin. Для генерации @XmlRootElement для всех «element» в файле схемы, необходимо добавить следующие строки в файл bindings.xjb:

и подключить его в конфигурации плагина maven-jaxb2-plugin, в pom.xml

Теперь собственно к коду, класс TagEngine хранит список обработчиков тэгов и занимается разбором:

Класс JAXBProcessor занимается unmarshalling’ом выделенных элементов. Класс XSLTProcessor вызывает XSLT преобразования. Вот так выглядит класс выполняющий полезную работу:

Пример применения XSLT DataThreeXSLT.

Пример запуска (эмулируется обработка 277 мегабайтного файла):

С памятью все хорошо, валидация конечно сильно тормозит обработку.

PS. Для тестов использовал Mockito (раньше использовал jmock). Понравилась возможность spy — перехват вызовов и их параметров при работе с живым (не mock) объектом.

Что такое код xslt_set_sax_handler

(PHP 4 >= 4.0.6, PECL)

xslt_set_sax_handlers — Set the SAX handlers to be called when the XML document gets processed

Description vo >xslt_set_sax_handlers ( resource processor, array handlers )

xslt_set_sax_handlers() registers the SAX handlers for the document, given a XSLT processor resource.

handlers should be an array in the following format:

«document» => array(
«start_doc» ,
«end_doc» ),

«element» => array(
«start_element» ,
«end_element» ),

«namespace» => array(
«start_namespace» ,
«end_namespace» ),

Чў: The given array does not need to contain all of the different sax handler elements (although it can), but it only needs to conform to «handler» => «function» format described above.

Each of the individual SAX handler functions are in the format below:

start_doc ( resource processor )

end_doc ( resource processor )

start_element ( resource processor, string name, array attributes )

end_element ( resource processor, string name )

start_namespace ( resource processor, string prefix, string uri )

end_namespace ( resource processor, string prefix )

comment ( resource processor, string contents )

pi ( resource processor, string target, string contents )

characters ( resource processor, string contents )

Using xslt_set_sax_handlers() doesn’t look very different than running a SAX parser like xml_parse() on the result of an xslt_process() transformation.

АэЧУ 1. xslt_set_sax_handlers() Example

// Handlers :
function start_document ()
<
// start reading the document
>

function end_document ()
<
// end reading the document
>

function start_element ( $parser , $name , $attributes )
<
global $result , $tag ;
$result .= » . $name . «>» ;
$tag = $name ;
>

function end_element ( $parser , $name )
<
global $result ;
$result .= » . $name . «>» ;
>

function characters ( $parser , $data )
<
global $result , $tag ;
if ( $tag == «auteur» ) <
$data = strtoupper ( $data );
>
$result .= $data ;
>

// Transformation :
$xh = xslt_create ();
$handlers = array( «document» => array( «start_document» , «end_document» ),
«element» => array( «start_element» , «end_element» ),
«character» => «characters» );

xslt_set_sax_handlers ( $xh , $handlers );
xslt_process ( $xh , ‘arg:/_xml’ , ‘arg:/_xsl’ , NULL , array( «/_xml» => $xml , «/_xsl» => $xsl ));
xslt_free ( $xh );
?>

АэЧУ 2. Object oriented handler

// This is the object oriented version of the previous example
class data_sax_handler <

var $buffer , $tag , $attrs ;

function data_sax_handler ( $xml , $xsl )
<
// our xslt resource
$this -> _xh = xslt_create ();

xslt_set_object ( $this -> _xs , $this );

// configure sax handlers
$handlers = array(
«document» => array( ‘start_document’ , ‘end_document’ ),
«element» => array( ‘start_element’ , ‘end_element’ ),
«character» => ‘characters’
);

xslt_set_sax_handlers ( $this -> _xh , $handlers );

xslt_process ( $this -> _xh , ‘arg:/_xml’ , ‘arg:/_xsl’ , NULL , array( «/_xml» => $xml , «/_xsl» => $xsl ));
xslt_free ( $this -> _xh );

function start_document ()
<
// start reading the document
>

function end_document () <
// complete reading the document
>

function start_element ( $parser , $name , $attributes ) <
$this -> tag = $name ;
$this -> buffer .= » . $name . «>» ;
$this -> attrs = $attributes ;
>

function end_element ( $parser , $name )
<
$this -> tag = » ;
$this -> buffer .= » . $name . «>» ;
>

function characters ( $parser , $data )
<
if ( $this -> tag == ‘auteur’ ) <
$data = strtoupper ( $data );
>
$this -> buffer .= $data ;
>

function get_buffer () <
return $this -> buffer ;
>

$exec = new data_sax_handler ( $xml , $xsl );

Что такое код xslt_set_sax_handler

(PHP 4 >= 4.0.6, PECL)

xslt_set_sax_handlers — Set the SAX handlers to be called when the XML document gets processed

Description vo >xslt_set_sax_handlers ( resource processor, array handlers )

xslt_set_sax_handlers() registers the SAX handlers for the document, given a XSLT processor resource.

handlers should be an array in the following format:

«document» => array(
«start_doc» ,
«end_doc» ),

«element» => array(
«start_element» ,
«end_element» ),

«namespace» => array(
«start_namespace» ,
«end_namespace» ),

Чў: The given array does not need to contain all of the different sax handler elements (although it can), but it only needs to conform to «handler» => «function» format described above.

Each of the individual SAX handler functions are in the format below:

start_doc ( resource processor )

end_doc ( resource processor )

start_element ( resource processor, string name, array attributes )

end_element ( resource processor, string name )

start_namespace ( resource processor, string prefix, string uri )

end_namespace ( resource processor, string prefix )

comment ( resource processor, string contents )

pi ( resource processor, string target, string contents )

characters ( resource processor, string contents )

Using xslt_set_sax_handlers() doesn’t look very different than running a SAX parser like xml_parse() on the result of an xslt_process() transformation.

АэЧУ 1. xslt_set_sax_handlers() Example

// Handlers :
function start_document ()
<
// start reading the document
>

function end_document ()
<
// end reading the document
>

function start_element ( $parser , $name , $attributes )
<
global $result , $tag ;
$result .= » . $name . «>» ;
$tag = $name ;
>

function end_element ( $parser , $name )
<
global $result ;
$result .= » . $name . «>» ;
>

function characters ( $parser , $data )
<
global $result , $tag ;
if ( $tag == «auteur» ) <
$data = strtoupper ( $data );
>
$result .= $data ;
>

// Transformation :
$xh = xslt_create ();
$handlers = array( «document» => array( «start_document» , «end_document» ),
«element» => array( «start_element» , «end_element» ),
«character» => «characters» );

xslt_set_sax_handlers ( $xh , $handlers );
xslt_process ( $xh , ‘arg:/_xml’ , ‘arg:/_xsl’ , NULL , array( «/_xml» => $xml , «/_xsl» => $xsl ));
xslt_free ( $xh );
?>

АэЧУ 2. Object oriented handler

// This is the object oriented version of the previous example
class data_sax_handler <

var $buffer , $tag , $attrs ;

function data_sax_handler ( $xml , $xsl )
<
// our xslt resource
$this -> _xh = xslt_create ();

xslt_set_object ( $this -> _xs , $this );

// configure sax handlers
$handlers = array(
«document» => array( ‘start_document’ , ‘end_document’ ),
«element» => array( ‘start_element’ , ‘end_element’ ),
«character» => ‘characters’
);

xslt_set_sax_handlers ( $this -> _xh , $handlers );

xslt_process ( $this -> _xh , ‘arg:/_xml’ , ‘arg:/_xsl’ , NULL , array( «/_xml» => $xml , «/_xsl» => $xsl ));
xslt_free ( $this -> _xh );

function start_document ()
<
// start reading the document
>

function end_document () <
// complete reading the document
>

function start_element ( $parser , $name , $attributes ) <
$this -> tag = $name ;
$this -> buffer .= » . $name . «>» ;
$this -> attrs = $attributes ;
>

function end_element ( $parser , $name )
<
$this -> tag = » ;
$this -> buffer .= » . $name . «>» ;
>

function characters ( $parser , $data )
<
if ( $this -> tag == ‘auteur’ ) <
$data = strtoupper ( $data );
>
$this -> buffer .= $data ;
>

function get_buffer () <
return $this -> buffer ;
>

$exec = new data_sax_handler ( $xml , $xsl );

Илон Маск рекомендует:  Что такое код pdf_set_border_dash
Понравилась статья? Поделиться с друзьями:
Кодинг, CSS и SQL