使用Objective-C HPPLE库解析HTML和XML

本文介绍如何在Objective-C中使用libxml和NSXMLParser解析HTML或XML,重点推荐了使用轻量级包装框架hpple,其支持HTML解析并提供XPath定位功能,通过详细步骤演示如何集成和应用该框架,包含实例代码。
 使用Objective-C解析HTML或者XML,系统自带有两种方式一个是通过libxml,一个是通过NSXMLParser。 libxml性能较好,且可以结合urlconnection实现边下载边解析,在要求快速 、分批响应UI到情况下较为有用,NSXMLParser基本没什么优势,不如使用第三方工具。

hpple,它是一个轻量级的包装框架,可以很好的解决这个问题,尤其是它支持HTML的解析,是其他XML类库所不及的地方,它是用XPath来定位和解析HTML或者XML。

使用步骤:
1。 -加入 libxml2 到你的项目中
到Project设置中,选all,找到Search paths下面的
Header Search Paths项目
添加新的 search path “${SDKROOT}/usr/include/libxml2″
注意选择 Enable recursive option


2. -加入 libxml2 library 到你的项目
到Target中,选择Build Phases页
在Link Binary With Libraries中
从列表中选择libxml2.dylib


3. 到https://github.com/topfunky/hpple 下载ZIP包

-将下面hpple的源代码加入到你的项目中:
HTFpple.h
HTFpple.m
HTFppleElement.h
HTFppleElement.m
XPathQuery.h
XPathQuery.m

 

4. xpath 权威教程 http://www.w3school.com.cn/xpath/index.asp

5. 简单例子:

 

[java]  view plain copy print ?
  1. #import "TFHpple.h"  
  2.    
  3. NSData *data = [[NSData alloc] initWithContentsOfFile:@"www.baidu.com"];  
  4.    
  5. // Create parser  
  6. xpathParser = [[TFHpple alloc] initWithHTMLData:data];  
  7.    
  8. //Get all the cells of the 2nd row of the 3rd table   
  9. NSArray *elements  = [xpathParser search:@"//title"];  
  10.    
  11. // Access the first cell  
  12. TFHppleElement *element = [elements objectAtIndex:0];  
  13.    
  14. // Get the text within the cell tag  
  15. NSString *content = [element content];    
  16.    
  17. [xpathParser release];  
  18. [data release];  

转载于:https://www.cnblogs.com/Jere-Jobs/archive/2013/03/02/2939919.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值