TinyXML2的基本使用之遍历和文本提取

XML是一种标记语言,被广泛用来作为跨平台之间交互数据的形式,主要针对数据的内容,通过不同的格式化描述手段(XSLT,CSS等)可以完成最终的形式表达(生成对应的HTML,PDF或者其他的文件格式)。

而TinyXML2是一个开源、简单、小巧、高效的C++ XML解析器,由于XML是由节点组成的,节点之间是树形结构,有根节点、父节点、子节点、兄弟节点等。所以可以把其当做树来处理和使用。

下面我们来看一下在C++中使用TinyXML2对XML文件进行遍历和提取信息的方法。

1.TinyXML2的相关数据类型

  • XMLDocument:代表整个XML文件。
  • XMLNode:XML文件是由节点组成的,节点之间是树形结构,所以就有根节点、父节点、子节点、兄弟节点。
  • XMLElement:对应于XML的元素
  • XMLAttribute:对应于XML中的元素的属性。
  • XMLText:对应于XML的文字部分
  • XMLComment:XML中的注释。
  • XmlUnknown:对应于XML的未知部分。
  • XmlHandler:定义了针对XML的一些操作。

可以根据需要使用上面的类型来定义对象。

2.TinyXML2查看的相关函数

  1. 加载文件信息,即要处理哪个文件
XMLDocument doc; 
doc.LoadFile(filename);//加载要处理的xml文档
if(doc.ERROR()){
	//检查是否打开成功
	cout << "open failed!" << endl;
}

类似C语言中文件打开fopen后,需要检查打开是否失败,有函数ErrorID。正常打开返回XML_SUCCESS=0,函数原型为:

XMLError  ErrorID() const {
    return _errorID;
}

XMLError:错误信息使用枚举值。

enum XMLError {
    XML_SUCCESS = 0,
    XML_NO_ATTRIBUTE,
    XML_WRONG_ATTRIBUTE_TYPE,
    XML_ERROR_FILE_NOT_FOUND,
    XML_ERROR_FILE_COULD_NOT_BE_OPENED,
    XML_ERROR_FILE_READ_ERROR,
    XML_ERROR_PARSING_ELEMENT,
    XML_ERROR_PARSING_ATTRIBUTE,
    XML_ERROR_PARSING_TEXT,
    XML_ERROR_PARSING_CDATA,
    XML_ERROR_PARSING_COMMENT,
    XML_ERROR_PARSING_DECLARATION,
    XML_ERROR_PARSING_UNKNOWN,
    XML_ERROR_EMPTY_DOCUMENT,
    XML_ERROR_MISMATCHED_ELEMENT,
    XML_ERROR_PARSING,
    XML_CAN_NOT_CONVERT_TEXT,
    XML_NO_TEXT_NODE,
    XML_ELEMENT_DEPTH_EXCEEDED,

    XML_ERROR_COUNT
};
  1. 获取根节点:(因为获取跟节点其实底层调用的还是FirstChildElement,所以直接使用FirstChildElement),因为xml文件是树形结构的文件,所以势必会有根节点、父子节点、兄弟节点。
XMLElement *root = doc.RootElement(); //获取根节点
  1. 获取孩子节点
//函数声明:
XMLElement *FirstChildElement();//获取第一个孩子结点
XMLElement *FirstChildElement(string label);//获取第一个标签为label的孩子结点
//实际使用:
//获取根节点下的第一个节点
XMLElement *curNode1 = root->FirstChildElement();
//获取根节点下的第一个节点的第一个"item"节点
XMLElement *curNode2 = root->FirstChildElement()->FirstChildElement("item");

因为FirstChildElement返回值还是XMLElement类型的指针(类似输出流运算符返回流对象引用一样),所以还可以继续使用FirstChildElement获取接下来的孩子节点。

  1. 使用NextSiblingElement函数获取兄弟节点,从而实现遍历
//返回下一个为item的的兄弟节点
XMLElement *nextNode = curNode->NextSiblingElement("item");
  1. 获取节点的文本信息,使用函数GetText()
//获取当前节点下的title节点中的文本信息,存放到string字符串中
string title = curNode->FirstChildElement("title")->GetText();

通过上面的几个函数,就可以实现对整个xml文档的遍历和文本提取了。

上一篇:yml报错:报错信息:panic: While parsing config: yaml: line 9: mapping values are not allowed in


下一篇:[LeetCode] 1106. Parsing A Boolean Expression 解析一个布尔型表达式