一、前言
用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。
JAXP接口包含了三个包:
(1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
(2)org.xml.sax 用于对XML进行语法分析的事件驱动的XML简单API(SAX)
(3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。
二、前提
DOM编程不要其它的依赖包,因为JDK里自带的JDK里含有的上面提到的org.w3c.dom、org.xml.sax 和javax.xml.parsers包就可以满意条件了。
三、使用DOM解析XML文档
我们现在来看看DOM是如何解析XML的吧!下面是一个简单的XML文件:
F:\book.xml
<?xml version="1.0" encoding="gb2312"?>
<books>
<book author="kok">
<name>java编程思想</name>
<price>108</price>
</book>
</books>
基本的根元素、属性、子节点都有,下面用JAVA解析这个XML
package com.donen.test; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; public class ReadXml { public static void main(String[] args) throws Exception
{
//得到DOM解析器的工厂实例
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//从DOM工厂获得DOM解析器
DocumentBuilder db = dbf.newDocumentBuilder();
/*
* 解析XML文档的输入流,得到一个Document。有三个常用的重载方法
* db.parse(File f) 文件
* db.parse(InputStream is) 流
* db.parse(String uri) 直接填写网页url 或者 本地文件路径 F:\\book.xml
*/
Document d = db.parse("F:\\test.xml");
//得到XML文档的根节点
Element root = d.getDocumentElement();
//得到节点
NodeList nl = root.getChildNodes();
//得到节点的子节点
for (int i = 0; i < nl.getLength(); i++) {
Node book = nl.item(i);
//轮循子节点
for (Node node = book.getFirstChild(); node != null; node = node.getNextSibling()) {
//节点的属性都是为Node.ELEMENT_NODE
if(node.getNodeType() == Node.ELEMENT_NODE)
//DOM把<name>java编程思想</name>也当作是两层结构的节点,其父节点是<name>,子节点java编程思想才是我们真正想得到的。所以去的值使用:book.getFirstChild().getNodeValue()
System.out.println(node.getNodeName() + "---" + node.getFirstChild().getNodeValue());
}
}
}
}