前言
前面已经介绍了Android平台下两种解析XML的方法,SAX和PULL,这两个均为事件驱动,以流的形式解析XML文档。现在介绍一种新的方式DOM方式解析XML。
DOM是一种用于XML文档对象模型,可用于直接访问XML文档的各个部位,在DOM中文档被模拟成树状,其中XML语法的每一组成部分都表示一个节点,DOM允许用户遍历文档树,从父节点移动到子节点和兄弟节点。并利用某节点类型特有的属性(元素具有属性,文本节点具有文本数据)。
对于DOM而言,XML文档中每一个成分都是一个节点。
DOM是这样规定的:
- 整个文档是一个文档节点。
- 每一个XML标签是一个元素节点。
- 包含在XML元素中的文本是一个文本节点。
- 每一个XML属性是一个属性节点。
DOM解析XML
DOM解析XML也是需要一个工厂类DocumentBuilderFactory,这一点和SAX、PULL类似。工厂类也是单例模式,没有提供共有的构造函数,需要使用静态的newInstance()方法获得,并且需要工厂类来获取DOM解析器实例,使用DocumentBuilderFactory.newDocumentBuilder()获得的DocumentBuilder对象。
当获得Document之后,就可以使用parse()解析XML文档,parser多个重载,可以适用于不同的输入。
下面介绍一下在DOM解析XML过程中,会碰上几个对象,Element、NodeList、Node。说也不太好说清楚,画个图解释一下更直观。
从图上可以看出,Element为一个元素,可以通过这个元素获取到该元素的属性值(Attribute),以及它的子节点的集合NodeList。而NodeList作为一个装载平级节点的集合,可以通过NodeList获得它内装载的所有平级节点,可以通过索引获取。对于Node,表示最终的节点,根据图示说的,其实Jack文本也是一个文本节点(Node),Node可以获取其节点名称、其值、其属性。所以它们三个是可以相互嵌套的,也不存在说谁一定要在谁的外侧或是内层。
示例程序
既然已经说了那么多了,现在通过一个示例程序展示一下DOM解析XML。这是一个Android应用程序,为了模拟真实的环境,通过网络读取IIS上的一个静态XML文件内容。直接上代码,注释已经写的很清楚了。
IIS上的静态XML文档内容:
<?xml version="1.0" encoding="utf-8" ?>
- <persons>
- <person id="23">
<name>Jack</name>
<age>21</age>
</person>
- <person id="20">
<name>Dick</name>
<age>23</age>
</person>
</persons>
DomService,解析网络传输来的XML文档流:
package cn.bgxt.service; import java.io.InputStream;
import java.util.ArrayList;
import java.util.List; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; import cn.bgxt.domain.Person; public class DomService { public DomService() {
// TODO Auto-generated constructor stub
} public static List<Person> getPersons(InputStream inputStream) throws Exception
{
List<Person> list=new ArrayList<Person>();
//获取工厂对象,以及通过DOM工厂对象获取DOMBuilder对象
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
//解析XML输入流,得到Document对象,表示一个XML文档
Document document=builder.parse(inputStream);
//获得文档中的次以及节点,persons
Element element=document.getDocumentElement();
// 获取Element下一级的person节点集合,以NodeList的形式存放。
NodeList personNodes=element.getElementsByTagName("person");
for(int i=0;i<personNodes.getLength();i++)
{
//循环获取索引为i的person节点
Element personElement=(Element) personNodes.item(i);
Person person=new Person();
//通过属性名,获取节点的属性id
person.setId(Integer.parseInt(personElement.getAttribute("id")));
//获取索引i的person节点下的子节点集合
NodeList childNodes=personElement.getChildNodes();
for(int j=0;j<childNodes.getLength();j++)
{
//循环遍历每个person下的子节点,如果判断节点类型是ELEMENT_NODE,就可以依据节点名称给予解析
if(childNodes.item(j).getNodeType()==Node.ELEMENT_NODE)
{
if("name".equals(childNodes.item(j).getNodeName()))
{
//因为文本也是一个文本节点,
//所以这里读取到name节点的时候,
//通过getFirstChild()可以直接获得name节点的下的第一个节点,就是name节点后的文本节点
//取其value值,就是文本的内容
person.setName(childNodes.item(j).getFirstChild().getNodeValue());
}
else if("age".equals(childNodes.item(j).getNodeName()))
{
person.setAge(Integer.parseInt(childNodes.item(j).getFirstChild().getNodeValue()));
}
}
}
//把解析的person对象加入的list集合中
list.add(person);
}
return list;
}
}
从IIS服务器上获取XML的方式,在另外一篇博客:HTTP协议。中已经介绍了,如果不明白可以去看看,这里就不介绍了。
Activity的布局就是一个按钮,用于点击出发解析事件,因为是Android4.0+的环境,需要无法在主线程中访问网络,需要使用到多线程的技术,并且不要网了给Android应用增加访问网络的权限。
package cn.bgxt.xmlfordom; import java.io.InputStream;
import java.util.List;
import cn.bgxt.domain.Person;
import cn.bgxt.http.HttpUtils;
import cn.bgxt.service.DomService;
import android.os.Bundle;
import android.app.Activity;
import android.util.Log;
import android.view.Menu;
import android.view.View;
import android.widget.Button; public class MainActivity extends Activity { private Button button; @Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main); button=(Button)findViewById(R.id.btn);
button.setOnClickListener(new View.OnClickListener() { @Override
public void onClick(View v) {
// Android 4.0+不能在主线程中访问网络
Thread thread=new Thread(new Runnable() {
@Override
public void run() {
try {
String path="http://192.168.1.107:1231/persons.xml";
InputStream inputStream=HttpUtils.getXML(path);
List<Person> list=DomService.getPersons(inputStream);
for(Person person:list)
{
//以日志的形式打印对象内容
Log.i("DOM", person.toString());
}
} catch (Exception e) {
// TODO: handle exception
}
} });
thread.start();
} }); } }
如果解析成功,可以在LogCat中查看到日志。
总结
现在已经讲解的常用的Android应用中解析XML的方法,DOM和PULL、SAX不一样,是文档模型形式的,在解析的时候会把整个XML的内容都读取到内存中,这样对于移动设备而言,是很消耗内存的。而PULL以及SAX都是事件驱动,逐行去解析XML的内容,相对而言保证了解析速度又不会很损耗内存。所以Android应用中一般不推荐使用DOM解析XML,还是偏向于使用SAX、PULL。但是DOM也有它的优点,正因为它是把整个文档都读取到内存中了,可以指定需要查找的数据而无需遍历所有的节点,对于内容比较少的XML而言,还是很方便的。所以解析XML的方法有很多,无法绝对的说明谁好谁坏,主要还是看需求设定的环境来取舍的。
请支持原创,尊重原创,转载请注明出处。谢谢。