微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用Objective-C解析HTML和XML

如何使用Objective-C解析HTML和XML


以下内容转载于cocoa论坛上禚来强老师的帖子

//作者:禚来强 iphone开发qq qun:79190809 邮箱:zhuolaiqiang@gmail.com 博客http://blog.csdn.net/diyagoanyhacker
使用Objective-C解析HTML或者XML,系统自带有两种方式一个是通过libxml,一个是通过NSXMLParser。不过这两种方式都需要自己写很多编码来处理抓取下来的内容,而且不是很直观。
一个比较好的类库hpple,它是一个轻量级的包装框架,可以很好的解决这个问题。它是用XPath来定位和解析HTML或者XML。
安装步骤:
-加入 libxml2 到你的项目中
Menu Project->Edit Project Settings
搜索 “Header Search Paths”
添加新的 search path “${SDKROOT}/usr/include/libxml2″
Enable recursive option
-加入 libxml2 library 到你的项目
Menu Project->Edit Project Settings
搜索 “Other Linker Flags”
添加新的 search flag “-lxml2″
-将下面hpple的源代码加入到你的项目中:
HTFpple.h
HTFpple.m
HTFppleElement.h
HTFppleElement.m
XPathQuery.h
XPathQuery.m
-XPath学习地址http://www.w3schools.com/XPath/default.asp
示例代码
#import "TFHpple.h"
NSData *data = [[NSData alloc] initWithContentsOfFile:@"example.html"];
// Create parser
xpathParser = [[TFHpple alloc] initWithHTMLData:data];
//Get all the cells of the 2nd row of the 3rd table
NSArray *elements  = [xpathParser search:@"//table[3]/tr[2]/td"];
// Access the first cell
TFHppleElement *element = [elements objectAtIndex:0];
// Get the text within the cell tag
Nsstring *content = [element content];  
[xpathParser release];
[data release];

下载地址:https://github.com/topfunky/hpple

另外,还有一个类似的解决方案可以参考
ElementParser http://github.com/Objective3/ElementParser

使用技巧请看:http://blog.csdn.net/diyagoanyhacker这个框架的详细应用方法和demo可以到我的博客 http://blog.csdn.net/diyagoanyhacker 查看

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐