1 XML概述
- XML是指可扩展的标记语言,很类似与HTML。它被设计的宗旨就是描述数据,而非显示数据。
- XML标签没有被预定义,需要用户自定定义标签。
- XML技术是W3C组织发布的。目前遵循的规范是1.0规范。
- XML被广泛认为是继java之后在Internet上最激动人心的新技术。
2 XML技术能够解决什么问题?
- XML语言出现的根本目的就是在于描述数据。
- XML是一种通用的数据交换格式。
- 在XML语言中,允许yoghurt自定义标签。一个标签用于描述一段数据,一个标签有开始标签和结束表现,在开始标签和结束标签之间,又可以使用其它标签描述其它数据,所以XML可以实现数据关系的描述。
- XML中的数据必须通过软件程序来解析和显示,这样的解析程序称为Parser解析器。
3 XML的常见应用
- 在java开发中,传统的配置文件是*.properties文件,而XML表示的数据更为丰富。
- XML技术除了用于描述有关系的数据外,还经常用于软件的配置文件,以描述程序模块之间的关系。
- 在一个软件系统中,通过XML配置文件可提供系统的灵活度,即程序的行为是通过XML文件来配置的,而不是硬编码。
4 XML的文档声明
- 在编写XML的时候,需要先使用文档声明来声明XML文档,且必须在第一行。
- 最简单的语法:<?xml version="1.0"?>
- 用encoding属性说明文件所使用的字符编码。
5 元素
- XML元素是指XML文件中出现的标签。一个标签分为起始和结束标签。
- 一个标签有若干个子标签,但所有标签必须合理的嵌套,不允许交叉嵌套。
- 一个XML文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签或后代标签。
- XML中不会忽略主题内容中出现的空格和换行。
- 元素的名称可以包含字母、数字、减号、下划线和英文句点,但必须遵守下面的一些规范:
- 严格区分大小写
- 只能以字母或下划线开头
- 不能以XML或xml开头
- 名车字符之间不能有空格或制表符
- 名称字符之间不能使用冒号
6 属性
- 一个元素可以有多个属性,每个属性都有它自己的名称和取值。
- 属性值一定要用引号引起来。
- 属性名称的命名规范和元素的命名规范相同。
- 元素中的属性是不允许重复的。
- 在XML技术中,标签属性所代表的信息也可以被改为子元素的形式描述。
7 注释
- XML中的注释语法为:<!-- 这是注释 -->
- 注意:
8 特殊字符
特殊字符 |
替代符号 |
& |
& |
< |
< |
> |
> |
" |
" |
' |
' |
9 XML约束
9.1 为什么需要约束
- XML都是用户自定义的标签,如果出现小小的错误,软件程序将不能正确的获取文件中的内容而报错。
- XML技术中,可以编写一个文档来约束一个XML的书写规范,这个文档被称之为约束。
- 格式良好的XML:遵循XML语法的XML。
- 有效的XML:遵循约束文档的XML。
- 总之:
- 约束文档定义了在XML中允许出现的元素名称、属性和元素出现的顺序等等。
9.2 常用的约束技术
9.3 DTD
- DTD:Document Type Definition:文档类型定义。
- 作用:约束XML的书写规范。
- DTD文件的扩展名是.dtd
9.4 编写DTD的方式
9.4.1 直接打dtd的内容放在XML文件中
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架>
<书>
<书名>java从入门到放弃</书名>
<作者>你好</作者>
<售价>0.01</售价>
</书>
<书>
<书名>c从入门到精通</书名>
<作者>我好</作者>
<售价>1.00</售价>
</书>
</书架>
9.4.2 dtd作为单独的文件存在
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE 书架 SYSTEM "book.dtd" >
<书架>
<书>
<书名>java从入门到放弃</书名>
<作者>你好</作者>
<售价>0.01</售价>
</书>
<书>
<书名>c从入门到精通</书名>
<作者>我好</作者>
<售价>1.00</售价>
</书>
</书架>
10 XML 的解析方式
11 java解析XML概述
- JAXP:开发包是JavaSE的一部分,它是由以下三个部分组成的:
- org.w3c.dom:提供DOM方式解析XML的标准接口
- org.xml.sax:提供SAX方式解析XML的标准接口
- javax.xml:提供了解析XML文档的类
- XML的解析开发包
- JAXP:是sun公司推出的解析标准实现。
- Dom4j:是开源组织推出的解析开发工具包。
12 使用JAXP进行DOM解析
- javax.xml.parsers包中的DocumentBuilderFactory用于创建DOM模式的解析器对象,DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance()方法,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。
- 获取JAXP中的DOM解析器
- ①调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂。
- ②调用工厂对象的newDocumentBuilder()方法得到DOM解析器对象。
- ③调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,这样就可以利用DOM特性对这个XML文档进行操作了。
<?xml version='1.0' encoding='UTF-8'?>
<书架>
<书>
<书名>java从入门到放弃</书名>
<作者>你好</作者>
<售价>0.01</售价>
</书>
<书>
<书名>c从入门到精通</书名>
<作者>我好</作者>
<售价>1.00</售价>
</书>
</书架>
package com;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;
/**
* 2017/10/28
* 说明:
*/
public class JAXPDemo {
public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException {
/*
* 通过DocumentBuilderFactory获取解析器工厂
*/
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
/**
* 通过解析器工厂获取解析器
*/
DocumentBuilder builder = builderFactory.newDocumentBuilder();
/**
* 解析器解析xml获取document对象
*/
Document document = builder.parse(new File("D:\\code\\web\\src\\main\\webapp\\book.xml"));
Node book = document.getElementsByTagName("书架").item(0);
if(book.getNodeType() == Node.ELEMENT_NODE){
Element e = (Element) book;
getNode(e);
}
}
private static void getNode(Node d) {
if(d.getNodeType() == Node.ELEMENT_NODE){
System.out.print(d.getNodeName()+"\n");
}
NodeList childNodes = d.getChildNodes();
for(int x = 0;x<childNodes.getLength();x++){
Node node = childNodes.item(x);
getNode(node);
}
}
}
<?xml version='1.0' encoding='UTF-8'?>
<书架>
<书>
<书名>java从入门到放弃</书名>
<作者>你好</作者>
<售价>0.01</售价>
</书>
<书>
<书名>c从入门到精通</书名>
<作者>我好</作者>
<售价>1.00</售价>
</书>
</书架>
package com;
import javafx.scene.transform.Transform;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
/**
* 2017/10/28
* 说明:
*/
public class JAXPDemo {
public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException, TransformerException {
/*
* 通过DocumentBuilderFactory获取解析器工厂
*/
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
/**
* 通过解析器工厂获取解析器
*/
DocumentBuilder builder = builderFactory.newDocumentBuilder();
/**
* 解析器解析xml获取document对象
*/
Document document = builder.parse(new File("D:\\code\\web\\src\\main\\webapp\\book.xml"));
Node authorNode = document.getElementsByTagName("作者").item(0);
if(authorNode.getNodeType() == Node.ELEMENT_NODE){
Element authorElement = (Element) authorNode;
authorElement.setTextContent("呵呵");
}
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document),new StreamResult(new FileOutputStream("D:\\code\\web\\src\\main\\webapp\\book.xml")));
}
}