微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

parser:parseErrorOccurred31#parser:parseErrorOccur

//取XML文件的前40个字节
NSData*xmldata=[self.ItemDatasubdataWithRange:NSMakeRange(0,40)];

//以UTF-8编码进行解码
Nsstring*xmlstr=[[Nsstringalloc]initWithData:xmldataencoding:NSUTF8StringEncoding];
//NSLog(@"XMLHEADER:%@",xmlstr);
//搜索GB2312,如果找到,就对整个文件进行编码转换
if([xmlstrrangeOfString:@"\"GB2312\""options:NSCaseInsensitiveSearch].location!=NSNotFound)
{
//NSLog(@"GB2312encodingfounded.");

nsstringencodingenc=CFStringConvertEncodingTonsstringencoding(kcfStringEncodingGB_18030_2000);
Nsstring*utf8str=[[[Nsstringalloc]initWithData:self.ItemDataencoding:enc]autorelease];
utf8str=[utf8strstringByReplacingOccurrencesOfString:@"\"GB2312\""withString:@"\"utf-8\""options:NSCaseInsensitiveSearchrange:NSMakeRange(0,40)];
NSData*newData=[utf8strdataUsingEncoding:NSUTF8StringEncoding];
self.ItemData=newData;
}

GB2312或GBK编码的网页,要先用gb编码解码,然后替换其中的gb字符串,再用utf8编码成data给parser就能解析中文网页了。


NSXMLParser 将停止解析在遇到特殊字符后


我读一个 XML 文件从谷歌天气 api 和解析它使用 NSXMLParser。城市问题是巴黎。这是我得到的简短 xml 输出

<?xmlversion="1.0"?>
<xml_api_replyversion="1">
<weathermodule_id="0"tab_id="0"mobile_row="0"mobile_zipped="1"row="0"section="0"><forecast_information>
<citydata="Paris,Île-de-France"/>
<postal_codedata="Paris"/>
<latitude_e6data=""/>
<longitude_e6data=""/>
...
...

现在我用来削去此 xml 的代码

Nsstring*address=@"http://www.google.com/ig/api?weather=Paris";
NSURL*URL=[NSURLURLWithString:address];

NSXMLParser*parser=[[NSXMLParseralloc]initWithContentsOfURL:URL];
[parsersetDelegate:self];
[parserparse];
...

-(void)parser:(NSXMLParser*)parserdidStartElement:(Nsstring*)elementNamenamespaceURI:(Nsstring*)namespaceURIqualifiedname:(Nsstring*)qualifiednameattributes:(NSDictionary*)attributeDict
{

NSLog(@"XMLParser1...elementName...%@",elementName);

}

这是我获得上述 xml 的输出

XMLParser1...elementName...xml_api_reply
XMLParser1...elementName...weather
XMLParser1...elementName...forecast_information

问题是它分析的所有标记,直到它到达"城市数据"因为巴黎 î l e de 法国,然后它就会停止的名称中有非 ascii 字符。它不会处理之后像 postal_code 的标签。纬度、 经度等。

所以我的问题是,有什么办法可以从返回的 URL XML 字符串中删除所有非 ascii 字符吗?

解决方法 1:

还行。我已经解决了此问题。这是怎么弄来的工作。

我首先做的就是用特殊字符的 URL 的 XML。然后我去掉从 XML 字符串的所有特殊字符。然后我将字符串转换为 NSdata 然后把 nsdata 对象传递给我的 NSXMLParser。因为它有没有更多特殊字符 NSXMLParser 是快乐。

这里是为任何人在将来可能会遇到的代码。大感谢您对这篇文章作出了贡献的人 !

Nsstring*address=@"http://www.google.com/ig/api?weather=Paris";
NSURL*URL=[NSURLURLWithString:address];
NSError*error;
Nsstring*XML=[NsstringstringWithContentsOfURL:URLencoding:NSASCIIStringEncodingerror:&error];

//REMOVEALLNON-ASCIICHaraCTERS
NSMutableString*asciiCharacters=[NSMutableStringstring];
for(NSIntegeri=32;i<127;i++)
{
[asciiCharactersappendFormat:@"%c",i];
}

NSCharacterSet*nonAsciiCharacterSet=[[NSCharacterSetcharacterSetWithCharactersInString:asciiCharacters]invertedSet];

XML=[[XMLcomponentsSeparatedByCharactersInSet:nonAsciiCharacterSet]componentsJoinedByString:@""];

NSData*data=[XMLdataUsingEncoding:NSUTF8StringEncoding];
NSXMLParser*parser=[[NSXMLParseralloc]initWithData:data];
[parsersetDelegate:self];
[parserparse];

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐