一、什么是XML。
可扩展标记语言(EXtensible Markup Language),标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
二、XML特点
1、XML与操作系统、编程语言和开发平台无关。、
2、实现不同系统、不同语言之间的数据交互。
三、XML基本结构
1、声明
<?xml version="1.0" encoding="UTF-8"?>
XML第一行必须为XML文档第一行, version表示XML的版本,encoding表示文档的编码格式,默认为utf-8。
2、根元素
XML文档是以树形结构保存数据,每个XML都有一个根元素,而且只能有一个。每个根元素必须有开始和结束标记。
3、元素
XML由用户自定义标记组成,一个元素就是一个标记。标记必须区分大小写,所有的标记必须成对出现,标记必须正确嵌套。
XML元素名称命名规范:
1)名称中可以包含包含字母、数字或者其他字符。
2)名称中不能以数字或标点符号开始。
3)名称中不能包含空格。
3)不能使用<>符号。
4、属性
<元素 属性="属性值" />
属性必须使用双引号包括,一个元素可以有多个属性,属性值中不能直接包含<,",&。
5、实体(转移字符)
实体 | 符号 |
< | < |
> | > |
& | & |
" | " |
' | ' |
6、CDATA节
用于把整段文本解释为纯字符数据而不是标签的情况。包含大量<,>,&或者"字符。CDATA节点中所有的字符都会被当做元素字符数据的常量部分,而不是XML标签。
语法:
<![CDATA[要显示的内容]]>
例:
<?xml version="1.0" encoding="UTF-8"?> <!--声明部分-->
<studentlist> <!--根节点-->
<student id="10086"> <!--子节点,id节点属性-->
<name>张三</name>
<age>20</age>
<description>
<![CDATA[个人说明:<title></title>]]>
</description>
</student>
<student id="10087">
<name>李四</name>
<age>22</age>
</student>
</studentlist>
四、格式良好的XML文档
1、必须有XML的声明语句
2、必须有且只有一个XML根元素。
3、标签大小写敏感。
4、属性使用双引号。
5、标签必须成对出现。
6、空标签关闭。
7、元素必须正确的嵌套。
8、必须对特殊字符使用实体