众所周知,xml常用语数据存储和传输,文件后缀为 .xml;
它是可扩展标记语言(Extensible Markup Language,简称XML),是一种标记语言。
如何定义这些标记,既可以选择国际通用的标记语言如HTML,也可以使用像XML这样由相关人士*决定的标记语言,这就是语言的可扩展性。XML设计用来传送及携带数据信息,不用来表现或展示数据,所以XML用途的焦点是它说明数据是什么,以及携带数据信息。而HTML语言则用来表现数据。可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具。早在1998年,W3C就发布了XML1.0规范,使用它来简化Internet的文档信息传输。
通过DOM4J API和标准DOM接口具有并行访问功能,DOM4J使用接口和抽象基本类方法。DOM4J大量使用了API中的Collections类,例如大名鼎鼎的hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性,那就采用DOM4J.
-------------------------------------------------
--------------------------------------------------
public static ArrayList<Employee> showEM() throws ParserConfigurationException, IOException, Exception{
ArrayList<Employee> list = new ArrayList<Employee>();
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse("employee.xml");
NodeList emList =doc.getElementsByTagName("em");
for(int i=0;i<emList.getLength();i++){
Employee emClass = new Employee();
Element em =(Element)emList.item(i);
String attrValue = em.getAttribute("id");
emClass.setNo(Integer.parseInt(attrValue));
NodeList em2List = em.getChildNodes();
for(int j=0;j<em2List.getLength();j++){
int type = item.getNodeType();
String content = item.getTextContent();
String name = item.getNodeName();
if(name != null && name.equals("emname")){
}else if(name!= null && name.equals("job")){
public static void main(String[] args) {
ArrayList<Employee> list = showEM();
for (int i = 0; i < list.size(); i++) {
System.out.println(list.get(i));
--------------------------------------------------
DOM4J解析xml整理
xml解析异常1:
java.io.UTFDataFormatException: Invalid byte 2 of 2-byte UTF-8 sequence.
由于声明的Xml是UTF-8编码的,而转换的时候使用默认的编码是gbk的
===============================
The processing instruction target matching "[xX][mM][lL]" is not allowed. activity_main.xml
<?xml version="1.0" encoding="UTF-8"?> 前面不能有空格
====================================
Document document = DocumentHelper.parseText(xmlResult);====
===================================
public void LoadXML(String path){
SAXReader saxReader= new SAXReader();
//read()的入参可以是File,InputStream,Reader,URL等多种方式....,用字节流加载防止中文乱码,很重要
=============================================
public void saveXML(String path){
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileWriter(path), format);
=========================================
将doc对象转化成xmlstring的格式,并可以将string打印出来。
Element root =doc.getRootElement();
拿根节点对象: Element rootElem = document.getRootElement();
获取某节点的单个子节点:Element memberElem = root.element("节点名");
获取根节点下的所有的名为name子节点的集合并遍历:(遍历之前先判断有无子节点)
List nodes= root.elements("name");
for(Iterator it = nodes.iterator() ; it.hasNext() ; ){
Element elm = (Element) it.next();
for(Iterator it = root.elementIterator() ; it.hasNext() ; ){
Element elm = (Element) it.next();
Element ageELm = newMenberElm.addElement("age");
Element.getParent().remove(Element);
==========================================
若有子节点,则得到的String为空串"",遍历之前先判断否则空指针异常,例:
String text = root.getTextTrim();
System.out.println("根节点的内容是:"+text);
Iterator<Element> item = root.elementIterator();
String text = root.elementText("name");
设置/修改节点的内容:Element.setText("内容");
修改节点的名字 :Element.setName()================================================
Atrribute attribute = root.attribute("size");
String text = attribute .getText();
Element.attributeValue("size");
for(Iterator it = root.attributeIterator() ; it.hasNext() ; ){
Atrribute attribute = it.next();
String text = attribute .getText();
Atrribute attribute = root.attribute("size");
//root.remove(root.attribute("size"));
添加节点属性 Element.addAttribute("language", "java");如果重复添加则覆盖,可当做修改操作
===============================================