XML是一种标记语言,被广泛用来作为跨平台之间交互数据的形式,主要针对数据的内容,通过不同的格式化描述手段(XSLT,CSS等)可以完成最终的形式表达(生成对应的HTML,PDF或者其他的文件格式)。
而TinyXML2是一个开源、简单、小巧、高效的C++ XML解析器,由于XML是由节点组成的,节点之间是树形结构,有根节点、父节点、子节点、兄弟节点等。所以可以把其当做树来处理和使用。
下面我们来看一下在C++中使用TinyXML2对XML文件进行遍历和提取信息的方法。
1.TinyXML2的相关数据类型
- XMLDocument:代表整个XML文件。
- XMLNode:XML文件是由节点组成的,节点之间是树形结构,所以就有根节点、父节点、子节点、兄弟节点。
- XMLElement:对应于XML的元素
- XMLAttribute:对应于XML中的元素的属性。
- XMLText:对应于XML的文字部分
- XMLComment:XML中的注释。
- XmlUnknown:对应于XML的未知部分。
- XmlHandler:定义了针对XML的一些操作。
可以根据需要使用上面的类型来定义对象。
2.TinyXML2查看的相关函数
- 加载文件信息,即要处理哪个文件
XMLDocument doc;
doc.LoadFile(filename);//加载要处理的xml文档
if(doc.ERROR()){
//检查是否打开成功
cout << "open failed!" << endl;
}
类似C语言中文件打开fopen后,需要检查打开是否失败,有函数ErrorID。正常打开返回XML_SUCCESS=0,函数原型为:
XMLError ErrorID() const {
return _errorID;
}
XMLError:错误信息使用枚举值。
enum XMLError {
XML_SUCCESS = 0,
XML_NO_ATTRIBUTE,
XML_WRONG_ATTRIBUTE_TYPE,
XML_ERROR_FILE_NOT_FOUND,
XML_ERROR_FILE_COULD_NOT_BE_OPENED,
XML_ERROR_FILE_READ_ERROR,
XML_ERROR_PARSING_ELEMENT,
XML_ERROR_PARSING_ATTRIBUTE,
XML_ERROR_PARSING_TEXT,
XML_ERROR_PARSING_CDATA,
XML_ERROR_PARSING_COMMENT,
XML_ERROR_PARSING_DECLARATION,
XML_ERROR_PARSING_UNKNOWN,
XML_ERROR_EMPTY_DOCUMENT,
XML_ERROR_MISMATCHED_ELEMENT,
XML_ERROR_PARSING,
XML_CAN_NOT_CONVERT_TEXT,
XML_NO_TEXT_NODE,
XML_ELEMENT_DEPTH_EXCEEDED,
XML_ERROR_COUNT
};
- 获取根节点:(因为获取跟节点其实底层调用的还是FirstChildElement,所以直接使用FirstChildElement),因为xml文件是树形结构的文件,所以势必会有根节点、父子节点、兄弟节点。
XMLElement *root = doc.RootElement(); //获取根节点
- 获取孩子节点
//函数声明:
XMLElement *FirstChildElement();//获取第一个孩子结点
XMLElement *FirstChildElement(string label);//获取第一个标签为label的孩子结点
//实际使用:
//获取根节点下的第一个节点
XMLElement *curNode1 = root->FirstChildElement();
//获取根节点下的第一个节点的第一个"item"节点
XMLElement *curNode2 = root->FirstChildElement()->FirstChildElement("item");
因为FirstChildElement返回值还是XMLElement类型的指针(类似输出流运算符返回流对象引用一样),所以还可以继续使用FirstChildElement获取接下来的孩子节点。
- 使用NextSiblingElement函数获取兄弟节点,从而实现遍历
//返回下一个为item的的兄弟节点
XMLElement *nextNode = curNode->NextSiblingElement("item");
- 获取节点的文本信息,使用函数GetText()
//获取当前节点下的title节点中的文本信息,存放到string字符串中
string title = curNode->FirstChildElement("title")->GetText();
通过上面的几个函数,就可以实现对整个xml文档的遍历和文本提取了。