好吧,一下博文转自:http://www.tuicool.com/articles/Qnmu6f
对xml进行解析的标准有两种:sax以及dom。
首先这两种标准并不是针对java的,他们在各种语言环境下都可以实现。dom是真正的国际标准。sax是事实的标准,它不由任何商业组织维 护,而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样,虽然sax不是正式的标准,但是一点不影响其在xml解析领域的地位。
dom实现的原理是把整个xml文档一次性读出,放在一个树型结构里。在需要的时候,查找特定节点,然后对节点进行读或写。它的主要优势是实现简单,读写平衡;缺点是比较占内存,因为他要把整个xml文档都读入内存,文件越大,这种缺点就越明显。
sax的实现方法和dom不同。
SAX解析XML,是基于事件通知的模式,一边读取XML文档一边处理,不必等整个文档加载完之后才采取操作,当在读取解析过程中遇到需要处理的对象,会发出通知对其进行处理。由于该方法 只在xml文档中查找特定条件的内容,并且只提取需要的内容。这样做占用内存小,灵活,正好满足我们的需求。
在iOS中,可以通过NSXMLParser实现sax方法解析xml文件。
对于NSXMLParser,常用的初始化方法有两种:通过XML的URL初始化和通过本地的XML文件初始化。
1.使用NSXMLParser解析XML网址数据
首先给出一个XML资源网址: http://rss.sina.com.cn/tech/index.shtml ,也就是新浪新闻频道列表,可以用来练习解析XML数据。
使用NSXMLParser解析XML数据的关键是实现NSXMLParserDelegate中的方法:
#pragma mark -
#pragma mark NSXMLParserDelegate
/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */
- (void)parserDidStartDocument:(NSXMLParser *)parser
{
NSLog(@"开始解析xml文件");
}
/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
attributes:(NSDictionary *)attributeDict
{
NSLog(@"发现节点");
}
/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
{
NSLog(@"正在解析节点内容");
}
/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
{
NSLog(@"解析节点结束");
}
/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError
{
NSLog(@"解析xml出错:%@", parseError);
}
/* 解析xml文件结束 */
- (void)parserDidEndDocument:(NSXMLParser *)parser
{
NSLog(@"解析xml文件结束");
}
在这里我选择了 view-source:http://rss.sina.com.cn/news/allnews/tech.xml 进行解析。
其中一项内容是:
<item>
<title>
<![CDATA[苹果设计主管艾维:设计最重要的是全心投入]]>
</title>
<link>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</link>
<author>SINA.com</author>
<guid>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</guid>
<category>
<![CDATA[科技新闻]]>
</category>
<pubDate>Fri, 11 Oct 2013 06:58:40 GMT</pubDate>
<comments></comments>
<description>
<![CDATA[ 新浪科技讯 北京时间10月11日下午消息,苹果首席设计师乔尼?艾维(Jony Ive)接受媒体采访时表示,设计产品的过程中最重要的是要真心重视这项工作,付出自己最大的努力。而且要加强与各种材料的亲身接触,不能过度依赖电脑建模。
“在对待人们不会立刻发现的事情时,我....]]>
</description>
</item>
在这里要解析的是新闻的标题title,摘要description,发布时间pubDate。
首先声明三个数组来存储这些新闻内容:
static NSString *xmlURLString = @"http://rss.sina.com.cn/news/allnews/tech.xml"; // 要解析的XML网址
@interface ViewController () <NSXMLParserDelegate>
@property (nonatomic, strong) NSMutableArray *newsTitles; // 标题
@property (nonatomic, strong) NSMutableArray *newsDescription; // 摘要
@property (nonatomic, strong) NSMutableArray *newsPublicDates; // 发布时间
@property (nonatomic, strong) NSMutableString *tempString; // 用于临时保存解析的字符数据
@property (nonatomic, strong) NSXMLParser *xmlParser; // XML解析器
@end
看看程序的界面:
有一个spinner_view用来指示正在解析xml数据,parse按钮按下后开始解析xml数据,showxml_textView用于显示解析后的新闻内容。
在按下parse按钮后,对解析器进行初始化并启动解析:
- (IBAction)parseXML:(id)sender {
xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];
xmlParser.delegate = self;
[xmlParser parse];
}
必须要设置解析器的委托为自己。
在parse方法调用后,将触发NSXMLParser中的方法,开始进行XML解析工作:
#pragma mark -
#pragma mark NSXMLParserDelegate
/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */
- (void)parserDidStartDocument:(NSXMLParser *)parser
{
[spinner_view startAnimating];
newsTitles = nil;
newsDescription = nil;
newsPublicDates = nil;
tempString = nil;
showxml_textView.text = @"";
NSLog(@"开始解析xml文件");
}
/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
attributes:(NSDictionary *)attributeDict
{
NSLog(@"发现节点");
if([elementName isEqualToString:@"title"])
{
if(newsTitles == nil)
newsTitles = [[NSMutableArray alloc] init];
}
else if([elementName isEqualToString:@"description"])
{
if(newsDescription == nil)
newsDescription = [[NSMutableArray alloc] init];
}
else if([elementName isEqualToString:@"pubDate"])
{
if(newsPublicDates == nil)
newsPublicDates = [[NSMutableArray alloc] init];
}
else {
}
}
/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
{
NSLog(@"正在解析节点内容");
if(self.tempString == nil)
self.tempString = [[NSMutableString alloc] init];
[self.tempString appendString:string];
}
/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
{
NSLog(@"解析节点结束");
if([elementName isEqualToString:@"title"])
{
[newsTitles addObject:self.tempString];
}
else if([elementName isEqualToString:@"description"])
{
[newsDescription addObject:self.tempString];
}
else if([elementName isEqualToString:@"pubDate"])
{
[newsPublicDates addObject:self.tempString];
}
else {
}
self.tempString = nil;
}
/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {
NSLog(@"解析xml出错:%@", parseError);
}
/* 解析xml文件结束 */
- (void)parserDidEndDocument:(NSXMLParser *)parser
{
if (!tempString) {
tempString = [[NSMutableString alloc] init];
}
for (int i = 2; i < 10; i++) {
[tempString appendString:newsTitles[i + 1]];
[tempString appendString:newsDescription[i]];
[tempString appendString:newsPublicDates[i]];
[tempString appendString:@"\n------------------------------------------------"];
}
showxml_textView.text = tempString;
NSLog(@"解析xml文件结束");
[spinner_view stopAnimating];
}
简单说一说该解析过程:
(1)在parse方法调用后,受委托的类首先调用委托中的
/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */
- (void)parserDidStartDocument:(NSXMLParser *)parser
方法进行一些初始化工作,比如清空保存新闻内容的数组,对界面内容操作等。
(2)在解析过程中,如果遇到xml开始标记,表明已经遇到了一个xml节点,此时将调用委托中的
/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
attributes:(NSDictionary *)attributeDict
方法开始解析这个节点。
这个时候,应该对存储节点的数组进行初始化工作。
(3)在解析节点时,将调用委托中的
/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
方法解析该节点中的所有字符。此时可以用一个tempString变量保存其中的字符内容。
(4)在遇到一个xml结束标记后,表明解析该xml节点结束,此时可以调用
/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
完成解析后的工作,例如将解析得到的结果存入数组中。
(5)如果解析出错,将调用
/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {
NSLog(@"解析xml出错:%@", parseError);
}
进行出错处理。
(6)如果解析没有出错,也就是在成功解析整个XML文件后,将调用
/* 解析xml文件成功 */
- (void)parserDidEndDocument:(NSXMLParser *)parser
在该方法中可以使用xml解析后的完整数据。
运行结果:
2.使用NSXMLParser解析本地的XML文件
可以在Xcode中新建一个RTF文件,然后将XML中的文字内容粘贴到该文件中,例如:
<?xml version="1.0" encoding="UTF-8"?>
<Data>
<Movie>
<title>good lucky to you</title>
<box>111</box>
<summary>This is a story</summary>
</Movie>
<Movie>
<title>hello</title>
<box>99</box>
<summary>oh,yes</summary>
</Movie>
<Movie>
<title>Cold</title>
<box>100</box>
<summary>I love cold weather</summary>
</Movie>
</Data>
最后将rtf后缀改为xml就可以了。
如果修改xml文件中的内容,比如去掉一个</summary>,那么在解析xml文件时将会出错,例如:
2013-10-11 16:46:27.777 XMLParserDemo[5636:a0b] 解析xml出错:Error Domain=NSXMLParserErrorDomain Code=76 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 76.)" UserInfo=0x8c40f70 {NSXMLParserErrorLineNumber=20, NSXMLParserErrorColumn=13, NSXMLParserErrorMessage=Opening and ending tag mismatch: summary line 0 and Movie
}
此时,程序将调用出错处理方法
/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {
NSLog(@"解析xml出错:%@", parseError);
}
但最终不会调用
- (void)parserDidEndDocument:(NSXMLParser *)parser
也就是说,只有解析xml成功,才会有parserDidEndDocument:方法的调用。
和解析xml的url数据唯一不同的是解析器的初始化方法不同,这里的是:
- (IBAction)parseXML:(id)sender {
// xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];
NSString *path = [[NSBundle mainBundle] pathForResource:@"xml" ofType:@"xml"]; // 找到文件路径
NSFileHandle *file = [NSFileHandle fileHandleForReadingAtPath:path]; // 创建文件处理器
NSData *data = [file readDataToEndOfFile]; // 读取文件中的二进制数据
[file closeFile]; // 关闭文件
xmlParser = [[NSXMLParser alloc] initWithData:data]; // 通过文件中的二进制数据初始化xml解析器
xmlParser.delegate = self; // 设置委托
[xmlParser parse]; // 开始转换
}
对于解析url的xml数据的解析器初始化方法为:
xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];
解析本地xml文件的解析器的初始化方法为:
NSFileHandle *file = [ NSFileHandle fileHandleForReadingAtPath :path]; // 创建文件处理器
NSData *data = [file readDataToEndOfFile ]; // 读取文件中的二进制数据
xmlParser = [[ NSXMLParser alloc ] initWithData :data]; // 通过文件中的二进制数据初始化 xml 解析器
其解析过程是一样的,只是修改一下各个节点的节点名就可以了。