微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

PHP用SAX解析XML的实现代码与问题分析

<div class="codetitle"><a style="CURSOR: pointer" data="1250" class="copybut" id="copybut1250" onclick="doCopy('code1250')"> 代码如下:

<div class="codebody" id="code1250">
<?PHP
$g_books = array();
$g_elem = null;
function startElement( $parser,$name,$attrs )
{
global $g_books,$g_elem;
if ( $name == 'BOOK' ) $g_books []= array();
$g_elem = $name;
}
function endElement( $parser,$name )
{
global $g_elem;
$g_elem = null;
}
function textData( $parser,$text )
{
global $g_books,$g_elem;
if ( $g_elem == 'AUTHOR' ||
$g_elem == 'PUBLISHER' ||
$g_elem == 'TITLE' )
{
$g_books[ count( $g_books ) - 1 ][ $g_elem ] = $text;
}
}
$parser = xml_parser_create();
xml_set_element_handler( $parser,"startElement","endElement" );
xml_set_character_data_handler( $parser,"textData" );
$f = fopen( 'books.xml','r' );
while( $data = fread( $f,4096 ) )
{
xml_parse( $parser,$data );
}
xml_parser_free( $parser );
foreach( $g_books as $book )
{
echo $book['TITLE']." - ".$book['AUTHOR']." - ";
echo $book['PUBLISHER']."\n";
}
?>

PHP中用SAX方式解析XML发现的问题

XML如下:
so.xml
<div class="codetitle"><a style="CURSOR: pointer" data="92964" class="copybut" id="copybut92964" onclick="doCopy('code92964')"> 代码如下:
<div class="codebody" id="code92964">
<?xml version="1.0" encoding="GBK"?>


1047869
2008-08-28 14:54:51
红花还需绿叶扶--浅谈脚架云台的选购
很多专业摄影师在选购三脚架的时候,往往出手阔绰,3、4000元一个的捷信或者曼富图三脚架常常不用经过思考就买下来了,可是,他们却总是忽视了云台的精挑细眩其实,数码相机架在三脚架上面究竟稳不稳,起决定作用的是云台,那么我们如何才能挑选到一款稳如磐石的云台呢?云台家族种类繁多用途迥异简单的说,脚架云台是用于连接相机与脚架进行角度调节的部件,主要分成三维云台和球型云台。三维云台在横向旋转

...(省略若干行)


xml_class.PHP
<div class="codetitle"><a style="CURSOR: pointer" data="70938" class="copybut" id="copybut70938" onclick="doCopy('code70938')"> 代码如下:
<div class="codebody" id="code70938">
<?PHP
class xml {
var $parser;
var $i =0;
var $search_result = array();
var $row = array();
var $data = array();
var $Now_tag;
var $tags = array("ID","CLASSID","SUBCLASSID","CLASSNAME","TITLE","SHORTTITLE","AUTHOR","PRODUCER","SUMMARY","CONTENT","DATE");
function xml()
{
$this->parser = xml_parser_create();
xml_set_object($this->parser,$this);
xml_set_element_handler($this->parser,"tag_open","tag_close");
xml_set_character_data_handler($this->parser,"cdata");
}
function parse($data)
{
xml_parse($this->parser,$data);
}
function tag_open($parser,$tag,$attributes)
{
$this->Now_tag=$tag;
if($tag=='RESULT') {
$this->search_result = $attributes;
}
if($tag=='ROW') {
$this->row[$this->i] = $attributes;
}
}
function cdata($parser,$cdata)
{
if(in_array($this->Now_tag,$this->tags)){
$tagname = strtolower($this->Now_tag);
$this->data[$this->i][$tagname] = $cdata;
}
}
function tag_close($parser,$tag)
{
$this->Now_tag="";
if($tag=='ROW') {
$this->i++;
}
}
}
?>

search.PHP
<div class="codetitle"><a style="CURSOR: pointer" data="10459" class="copybut" id="copybut10459" onclick="doCopy('code10459')"> 代码如下:
<div class="codebody" id="code10459">
<?PHP
require_once("./xml_class.PHP");
$xml = file_get_contents("./so.xml");
$xml_parser = new xml();
$xml_parser->parse($xml);
print_r($xml_parser);
?>

最后得到的结果中summary中的数据少了很多,总是得不到完整的summary内容。有时还会得到乱码,在网上也找了半天也不知道是什么问题引起的。
  后来才发现问题是因为xml_parser解析XML是循环处理节点中的数据的,每次只取大概300个字符长度(具体是多少,我也不太清楚,只是用strlen输出大概在300左右),于是才知道是因为每次的循环就会把前次的数据给复盖了,这样就会出现数据不全的问题。
  解决办法就是把xml_class文件中的xml类中的cdata方法中$this->data[$this->i][$tagname] = $cdata;改为$this->data[$this->i][$tagname] .= $cdata;即可解决(其中有一些NOTICE错误PHP已忽略了).

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

SAXXML

相关推荐


统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返回预支付订单号的接口,目前微信支付所有场景均使用这一接口。下面介绍的是其中NATIVE的支付实现流程与PC端实现扫码支付流程
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返回预支付订单号的接口,目前微信支付所有场景均使用这一接口。下面介绍的是其中APP的支付的配置与实现流程
前言 之前做了微信登录,所以总结一下微信授权登录并获取用户信息这个功能的开发流程。 配置 1.首先得在微信公众平台申请一下微信小程序账号并获取到小程序的AppID和AppSecret https://mp.weixin.qq.com/cgi-bin/loginpage?url=%2Fwxamp%2F
FastAdmin是我第一个接触的后台管理系统框架。FastAdmin是一款开源且免费商用的后台开发框架,它基于ThinkPHP和Bootstrap两大主流技术构建的极速后台开发框架,它有着非常完善且强大的功能和便捷的开发体验,使我逐渐喜欢上了它。
之前公司需要一个内部的通讯软件,就叫我做一个。通讯软件嘛,就离不开通讯了,然后我就想到了长连接。这里本人用的是GatewayWorker框架。
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返回预支付订单号的接口,目前微信支付所有场景均使用这一接口。下面介绍的是其中JSAPI的支付实现流程
服务器优化必备:深入了解PHP8底层开发原理
Golang的网络编程:如何快速构建高性能的网络应用?
Golang和其他编程语言的对比:为什么它的开发效率更高?
PHP8底层开发原理揭秘:如何利用新特性创建出色的Web应用