XML (一)

1 XML概述

  • XML是指可扩展的标记语言,很类似与HTML。它被设计的宗旨就是描述数据,而非显示数据。
  • XML标签没有被预定义,需要用户自定定义标签。
  • XML技术是W3C组织发布的。目前遵循的规范是1.0规范。
  • XML被广泛认为是继java之后在Internet上最激动人心的新技术。

2 XML技术能够解决什么问题?

  • XML语言出现的根本目的就是在于描述数据。
  • XML是一种通用的数据交换格式。
  • 在XML语言中,允许yoghurt自定义标签。一个标签用于描述一段数据,一个标签有开始标签和结束表现,在开始标签和结束标签之间,又可以使用其它标签描述其它数据,所以XML可以实现数据关系的描述。
  • XML中的数据必须通过软件程序来解析和显示,这样的解析程序称为Parser解析器。

3 XML的常见应用

  • 在java开发中,传统的配置文件是*.properties文件,而XML表示的数据更为丰富。
  • XML技术除了用于描述有关系的数据外,还经常用于软件的配置文件,以描述程序模块之间的关系。
  • 在一个软件系统中,通过XML配置文件可提供系统的灵活度,即程序的行为是通过XML文件来配置的,而不是硬编码。

4 XML的文档声明

  • 在编写XML的时候,需要先使用文档声明来声明XML文档,且必须在第一行。
  • 最简单的语法:<?xml version="1.0"?>
  • 用encoding属性说明文件所使用的字符编码。

5 元素

  • XML元素是指XML文件中出现的标签。一个标签分为起始和结束标签。
  • 一个标签有若干个子标签,但所有标签必须合理的嵌套,不允许交叉嵌套。
  • 一个XML文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签或后代标签。
  • XML中不会忽略主题内容中出现的空格和换行。
  • 元素的名称可以包含字母、数字、减号、下划线和英文句点,但必须遵守下面的一些规范:
    • 严格区分大小写
    • 只能以字母或下划线开头
    • 不能以XML或xml开头
    • 名车字符之间不能有空格或制表符
    • 名称字符之间不能使用冒号  

6 属性

  • 一个元素可以有多个属性,每个属性都有它自己的名称和取值。
  • 属性值一定要用引号引起来。
  • 属性名称的命名规范和元素的命名规范相同。
  • 元素中的属性是不允许重复的。
  • 在XML技术中,标签属性所代表的信息也可以被改为子元素的形式描述。

7 注释

  • XML中的注释语法为:<!-- 这是注释 -->
  • 注意:
    • XML声明之前不能有注释。
    • 注释不能嵌套。  

8 特殊字符

特殊字符 替代符号
& &amp;
< &lt;
> &gt;
" &quot;
' &apos;

9 XML约束

9.1 为什么需要约束

  • XML都是用户自定义的标签,如果出现小小的错误,软件程序将不能正确的获取文件中的内容而报错。
  • XML技术中,可以编写一个文档来约束一个XML的书写规范,这个文档被称之为约束。
  • 格式良好的XML:遵循XML语法的XML。
  • 有效的XML:遵循约束文档的XML。
  • 总之:
    • 约束文档定义了在XML中允许出现的元素名称、属性和元素出现的顺序等等。  

9.2 常用的约束技术

  • DTD
  • Schema

9.3 DTD

  • DTD:Document Type  Definition:文档类型定义。
  • 作用:约束XML的书写规范。
  • DTD文件的扩展名是.dtd

9.4 编写DTD的方式

9.4.1 直接打dtd的内容放在XML文件中

  • 示例:
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE 书架 [
    <!ELEMENT 书架 (书+)>
    <!ELEMENT 书 (书名,作者,售价)>
    <!ELEMENT 书名 (#PCDATA)>
    <!ELEMENT 作者 (#PCDATA)>
    <!ELEMENT 售价 (#PCDATA)>
]>
<书架>
    <书>
        <书名>java从入门到放弃</书名>
        <作者>你好</作者>
        <售价>0.01</售价>
    </书>
    <书>
        <书名>c从入门到精通</书名>
        <作者>我好</作者>
        <售价>1.00</售价>
    </书>
</书架>

9.4.2 dtd作为单独的文件存在

  • book.dtd
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
  • book.xml
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE 书架 SYSTEM "book.dtd" >
<书架>
    <书>
        <书名>java从入门到放弃</书名>
        <作者>你好</作者>
        <售价>0.01</售价>
    </书>
    <书>
        <书名>c从入门到精通</书名>
        <作者>我好</作者>
        <售价>1.00</售价>
    </书>
</书架>

10 XML 的解析方式

  • DOM
  • SAX

11 java解析XML概述

  • JAXP:开发包是JavaSE的一部分,它是由以下三个部分组成的:
    • org.w3c.dom:提供DOM方式解析XML的标准接口
    • org.xml.sax:提供SAX方式解析XML的标准接口
    • javax.xml:提供了解析XML文档的类  
  • XML的解析开发包
    • JAXP:是sun公司推出的解析标准实现。
    • Dom4j:是开源组织推出的解析开发工具包。  

12 使用JAXP进行DOM解析

  • javax.xml.parsers包中的DocumentBuilderFactory用于创建DOM模式的解析器对象,DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance()方法,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。
  • 获取JAXP中的DOM解析器
    • ①调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂。
    • ②调用工厂对象的newDocumentBuilder()方法得到DOM解析器对象。
    • ③调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,这样就可以利用DOM特性对这个XML文档进行操作了。  
  • 示例:读取所有节点的名称
<?xml version='1.0' encoding='UTF-8'?>
<书架>
    <书>
        <书名>java从入门到放弃</书名>
        <作者>你好</作者>
        <售价>0.01</售价>
    </书>
    <书>
        <书名>c从入门到精通</书名>
        <作者>我好</作者>
        <售价>1.00</售价>
    </书>
</书架>
package com;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;

/**
 * 2017/10/28
 * 说明:
 */
public class JAXPDemo {
    public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException {
        /*
        * 通过DocumentBuilderFactory获取解析器工厂
        */
        DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
        /**
         * 通过解析器工厂获取解析器
         */
        DocumentBuilder builder = builderFactory.newDocumentBuilder();
        /**
         * 解析器解析xml获取document对象
         */
        Document document =  builder.parse(new File("D:\\code\\web\\src\\main\\webapp\\book.xml"));

        Node book =  document.getElementsByTagName("书架").item(0);

        if(book.getNodeType() == Node.ELEMENT_NODE){
            Element e = (Element) book;

            getNode(e);

        }

    }

    private static void getNode(Node d) {
        if(d.getNodeType() == Node.ELEMENT_NODE){
            System.out.print(d.getNodeName()+"\n");
        }
        NodeList childNodes = d.getChildNodes();
        for(int x = 0;x<childNodes.getLength();x++){
            Node node = childNodes.item(x);
            getNode(node);
        }

    }
}
  • 示例:将书名是java从入门到放弃的作者改为呵呵
<?xml version='1.0' encoding='UTF-8'?>
<书架>
<书>
    <书名>java从入门到放弃</书名>
    <作者>你好</作者>
    <售价>0.01</售价>
</书>
<书>
    <书名>c从入门到精通</书名>
    <作者>我好</作者>
    <售价>1.00</售价>
</书>
</书架>
package com;

import javafx.scene.transform.Transform;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;

/**
 * 2017/10/28
 * 说明:
 */
public class JAXPDemo {
    public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException, TransformerException {
        /*
        * 通过DocumentBuilderFactory获取解析器工厂
        */
        DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
        /**
         * 通过解析器工厂获取解析器
         */
        DocumentBuilder builder = builderFactory.newDocumentBuilder();
        /**
         * 解析器解析xml获取document对象
         */
        Document document =  builder.parse(new File("D:\\code\\web\\src\\main\\webapp\\book.xml"));

        Node authorNode  = document.getElementsByTagName("作者").item(0);

        if(authorNode.getNodeType() == Node.ELEMENT_NODE){
            Element authorElement = (Element) authorNode;

            authorElement.setTextContent("呵呵");
        }

        TransformerFactory transformerFactory = TransformerFactory.newInstance();

        Transformer transformer = transformerFactory.newTransformer();

        transformer.transform(new DOMSource(document),new StreamResult(new FileOutputStream("D:\\code\\web\\src\\main\\webapp\\book.xml")));

    }

}
上一篇:wait() notify()搭配synchronize的使用


下一篇:npm run dev 出错的解决办法