Java解析XML文档——dom解析xml

2022-09-29 20:51:20

一、前言
　　
　　用Java解析XML文档，最常用的有两种方法：使用基于事件的XML简单API（Simple API for XML）称为SAX和基于树和节点的文档对象模型（Document Object Module）称为DOM。Sun公司提供了Java API for XML Parsing（JAXP）接口来使用SAX和DOM，通过JAXP，我们可以使用任何与JAXP兼容的XML解析器。
　　
　　JAXP接口包含了三个包：
　　
　　（1）org.w3c.dom　W3C推荐的用于XML标准规划文档对象模型的接口。
　　
　　（2）org.xml.sax　用于对XML进行语法分析的事件驱动的XML简单API（SAX）
　　
　　（3）javax.xml.parsers解析器工厂工具，程序员获得并配置特殊的特殊语法分析器。
　　
　　二、前提
　　
　　DOM编程不要其它的依赖包，因为JDK里自带的JDK里含有的上面提到的org.w3c.dom、org.xml.sax 和javax.xml.parsers包就可以满意条件了。
　　
　　三、使用DOM解析XML文档
　　

　　我们现在来看看DOM是如何解析XML的吧！下面是一个简单的XML文件：

F:\book.xml

<?xml version="1.0" encoding="gb2312"?>

<books>

　<book author="kok">

　　<name>java编程思想</name>

　　<price>108</price>

　</book>

</books>

基本的根元素、属性、子节点都有，下面用JAVA解析这个XML

package com.donen.test;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

public class ReadXml {

    public static void main(String[] args) throws Exception

    {

        //得到DOM解析器的工厂实例

        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

        //从DOM工厂获得DOM解析器

        DocumentBuilder db = dbf.newDocumentBuilder();

        /*

         * 解析XML文档的输入流，得到一个Document。有三个常用的重载方法

         * db.parse(File f) 文件

         * db.parse(InputStream is) 流

         * db.parse(String uri) 直接填写网页url 或者 本地文件路径  F:\\book.xml

         */

        Document d = db.parse("F:\\test.xml");

        //得到XML文档的根节点

        Element root = d.getDocumentElement();

        //得到节点

        NodeList nl = root.getChildNodes();

        //得到节点的子节点

        for (int i = 0; i < nl.getLength(); i++) {

            Node book = nl.item(i);

            //轮循子节点

            for (Node node = book.getFirstChild(); node != null; node = node.getNextSibling()) {

                //节点的属性都是为Node.ELEMENT_NODE

                if(node.getNodeType() == Node.ELEMENT_NODE)

                    //DOM把<name>java编程思想</name>也当作是两层结构的节点，其父节点是<name>，子节点java编程思想才是我们真正想得到的。所以去的值使用：book.getFirstChild().getNodeValue()

                    System.out.println(node.getNodeName() + "---" + node.getFirstChild().getNodeValue());

            }

        }

    }

}

码农公寓

相关文章