Android--解析XML之DOM

2023-08-02 17:08:22

前言

　　前面已经介绍了Android平台下两种解析XML的方法，SAX和PULL，这两个均为事件驱动，以流的形式解析XML文档。现在介绍一种新的方式DOM方式解析XML。

　　DOM是一种用于XML文档对象模型，可用于直接访问XML文档的各个部位，在DOM中文档被模拟成树状，其中XML语法的每一组成部分都表示一个节点，DOM允许用户遍历文档树，从父节点移动到子节点和兄弟节点。并利用某节点类型特有的属性（元素具有属性，文本节点具有文本数据）。

　　对于DOM而言，XML文档中每一个成分都是一个节点。

　　DOM是这样规定的：

整个文档是一个文档节点。
每一个XML标签是一个元素节点。
包含在XML元素中的文本是一个文本节点。
每一个XML属性是一个属性节点。

DOM解析XML

　　DOM解析XML也是需要一个工厂类DocumentBuilderFactory，这一点和SAX、PULL类似。工厂类也是单例模式，没有提供共有的构造函数，需要使用静态的newInstance()方法获得，并且需要工厂类来获取DOM解析器实例，使用DocumentBuilderFactory.newDocumentBuilder()获得的DocumentBuilder对象。

　　当获得Document之后，就可以使用parse()解析XML文档，parser多个重载，可以适用于不同的输入。

　　下面介绍一下在DOM解析XML过程中，会碰上几个对象，Element、NodeList、Node。说也不太好说清楚，画个图解释一下更直观。

　　从图上可以看出，Element为一个元素，可以通过这个元素获取到该元素的属性值（Attribute），以及它的子节点的集合NodeList。而NodeList作为一个装载平级节点的集合，可以通过NodeList获得它内装载的所有平级节点，可以通过索引获取。对于Node，表示最终的节点，根据图示说的，其实Jack文本也是一个文本节点（Node），Node可以获取其节点名称、其值、其属性。所以它们三个是可以相互嵌套的，也不存在说谁一定要在谁的外侧或是内层。

示例程序

　　既然已经说了那么多了，现在通过一个示例程序展示一下DOM解析XML。这是一个Android应用程序，为了模拟真实的环境，通过网络读取IIS上的一个静态XML文件内容。直接上代码，注释已经写的很清楚了。

　　IIS上的静态XML文档内容：

   <?xml version="1.0" encoding="utf-8" ?>

 - <persons>

 - <person id="23">

   <name>Jack</name>

   <age>21</age>

   </person>

 - <person id="20">

   <name>Dick</name>

   <age>23</age>

   </person>

   </persons>

　　DomService，解析网络传输来的XML文档流：

package cn.bgxt.service;

import java.io.InputStream;

import java.util.ArrayList;

import java.util.List;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import cn.bgxt.domain.Person;

public class DomService {

    public DomService() {

        // TODO Auto-generated constructor stub

    }

    public static List<Person> getPersons(InputStream inputStream) throws Exception

    {

        List<Person> list=new ArrayList<Person>();

        //获取工厂对象，以及通过DOM工厂对象获取DOMBuilder对象

        DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

        DocumentBuilder builder=factory.newDocumentBuilder();

        //解析XML输入流，得到Document对象，表示一个XML文档

        Document document=builder.parse(inputStream);

        //获得文档中的次以及节点，persons

        Element element=document.getDocumentElement();

        // 获取Element下一级的person节点集合，以NodeList的形式存放。

        NodeList personNodes=element.getElementsByTagName("person");

        for(int i=0;i<personNodes.getLength();i++)

        {

            //循环获取索引为i的person节点

            Element personElement=(Element) personNodes.item(i);

            Person person=new Person();

            //通过属性名，获取节点的属性id

            person.setId(Integer.parseInt(personElement.getAttribute("id")));

            //获取索引i的person节点下的子节点集合

            NodeList childNodes=personElement.getChildNodes();

            for(int j=0;j<childNodes.getLength();j++)

            {

                //循环遍历每个person下的子节点，如果判断节点类型是ELEMENT_NODE，就可以依据节点名称给予解析

                if(childNodes.item(j).getNodeType()==Node.ELEMENT_NODE)

                {

                    if("name".equals(childNodes.item(j).getNodeName()))

                    {

                        //因为文本也是一个文本节点，

                        //所以这里读取到name节点的时候，

                        //通过getFirstChild()可以直接获得name节点的下的第一个节点，就是name节点后的文本节点

                        //取其value值，就是文本的内容

                        person.setName(childNodes.item(j).getFirstChild().getNodeValue());

                    }

                    else if("age".equals(childNodes.item(j).getNodeName()))

                    {

                        person.setAge(Integer.parseInt(childNodes.item(j).getFirstChild().getNodeValue()));

                    }

                }

            }

            //把解析的person对象加入的list集合中

            list.add(person);

        }

        return list;

    }

}

　　从IIS服务器上获取XML的方式，在另外一篇博客：HTTP协议。中已经介绍了，如果不明白可以去看看，这里就不介绍了。

　　Activity的布局就是一个按钮，用于点击出发解析事件，因为是Android4.0+的环境，需要无法在主线程中访问网络，需要使用到多线程的技术，并且不要网了给Android应用增加访问网络的权限。

 package cn.bgxt.xmlfordom;

 import java.io.InputStream;

 import java.util.List;

 import cn.bgxt.domain.Person;

 import cn.bgxt.http.HttpUtils;

 import cn.bgxt.service.DomService;

 import android.os.Bundle;

 import android.app.Activity;

 import android.util.Log;

 import android.view.Menu;

 import android.view.View;

 import android.widget.Button;

 public class MainActivity extends Activity {

     private Button button;

     @Override

     protected void onCreate(Bundle savedInstanceState) {

         super.onCreate(savedInstanceState);

         setContentView(R.layout.activity_main);

         button=(Button)findViewById(R.id.btn);

         button.setOnClickListener(new View.OnClickListener() {

             @Override

             public void onClick(View v) {

                 // Android 4.0+不能在主线程中访问网络

                 Thread thread=new Thread(new Runnable() {

                     @Override

                     public void run() {

                         try {

                             String path="http://192.168.1.107:1231/persons.xml";

                             InputStream inputStream=HttpUtils.getXML(path);

                             List<Person> list=DomService.getPersons(inputStream);

                             for(Person person:list)

                             {

                                 //以日志的形式打印对象内容

                                 Log.i("DOM", person.toString());

                             }

                         } catch (Exception e) {

                             // TODO: handle exception

                         }

                     }

                 });

                 thread.start();

             }

         });

     }

 }

　　如果解析成功，可以在LogCat中查看到日志。

　　示例程序源码

总结

　　现在已经讲解的常用的Android应用中解析XML的方法，DOM和PULL、SAX不一样，是文档模型形式的，在解析的时候会把整个XML的内容都读取到内存中，这样对于移动设备而言，是很消耗内存的。而PULL以及SAX都是事件驱动，逐行去解析XML的内容，相对而言保证了解析速度又不会很损耗内存。所以Android应用中一般不推荐使用DOM解析XML，还是偏向于使用SAX、PULL。但是DOM也有它的优点，正因为它是把整个文档都读取到内存中了，可以指定需要查找的数据而无需遍历所有的节点，对于内容比较少的XML而言，还是很方便的。所以解析XML的方法有很多，无法绝对的说明谁好谁坏，主要还是看需求设定的环境来取舍的。

　　请支持原创，尊重原创，转载请注明出处。谢谢。

码农公寓

相关文章