开源解析XML的解析库TinyXML
最近在做公司项目的需求,要对配置文件进行操作,从而接触了MSXML2和TinyXML,公司的公共库是用微软的MSXML2实现的,实现起来比较麻烦的,刚开始看的时候有点小困难,网上就搜索了一些c++方面的解析器,觉得开源的TinyXML还是不错的,使用起来很舒服,因为它的API接口和JAVA的十分类似,面向对象性很好。
TinyXML是一个开源的解析XML的解析库,能够用于C++,能够在Windows或Linux中编译。这个解析库的模型通过解析XML文件,然后在内存中生成DOM模型,从而让我们很方便的遍历这棵XML树。DOM模型即文档对象模型,是将整个文档分成多个元素(如书、章、节、段等),并利用树型结构表示这些元素之间的顺序关系以及嵌套包含关系。
要用TinyXML,主要需要两个文件头(.h)以及四个源文件(.c++),将其导入到需要的工程,当然也可以编译成dll文件进行调用,所需要的文件会在我的例子工程中存在,可以自主去下载运行看,以下是TinyXMLDemo源码。
首先要通过TinyXML创建xml文件,代码如下:
bool CreateXmlFile(wstring& szFileName)
{//创建xml文件,szFilePath为文件保存的路径,若创建成功返回true,否则false
try
{
//创建一个XML的文档对象。
TiXmlDocument *myDocument = new TiXmlDocument();
//创建一个根元素并连接。
TiXmlElement *RootElement = new TiXmlElement("Persons");
myDocument->LinkEndChild(RootElement);
//创建一个Person元素并连接。
TiXmlElement *PersonElement = new TiXmlElement("Person");
RootElement->LinkEndChild(PersonElement);
//设置Person元素的属性。
PersonElement->SetAttribute("ID", "1");
//创建name元素、age元素并连接。
TiXmlElement *NameElement = new TiXmlElement("name");
TiXmlElement *AgeElement = new TiXmlElement("age");
PersonElement->LinkEndChild(NameElement);
PersonElement->LinkEndChild(AgeElement);
//设置name元素和age元素的内容并连接。
TiXmlText *NameContent = new TiXmlText("周星星");
TiXmlText *AgeContent = new TiXmlText("22");
NameElement->LinkEndChild(NameContent);
AgeElement->LinkEndChild(AgeContent);
CString appPath = GetAppPath();
wstring seperator = L"\\";
wstring fullPath = appPath.GetBuffer(0) +seperator+szFileName;
myDocument->SaveFile(ws2s(fullPath).c_str());//保存到文件
}
catch (string& e)
{
return false;
}
return true;
}
代码中详细用注解表示出了创建过程以及相应代码的作用,其中一些小细节将在最后统一进行阐述。
接下来就是要读xml文件,代码如下:
bool ReadXmlFile(wstring& szFileName)
{//读取Xml文件,并遍历
try
{
CString appPath = GetAppPath();
wstring seperator = L"\\";
wstring fullPath = appPath.GetBuffer(0) +seperator+szFileName;
//创建一个XML的文档对象。
TiXmlDocument *myDocument = new TiXmlDocument(ws2s(fullPath).c_str());
myDocument->LoadFile();
//获得根元素,即Persons。
TiXmlElement *RootElement = myDocument->RootElement();
//输出根元素名称,即输出Persons。
cout << RootElement->Value() << endl;
//获得第一个Person节点。
cout<<RootElement->Column()<<"ddd"<<endl;
TiXmlElement *FirstPerson = RootElement->FirstChildElement();
//获得第一个Person的name节点和age节点和ID属性。
TiXmlElement *NameElement = FirstPerson->FirstChildElement();
TiXmlElement *AgeElement = NameElement->NextSiblingElement();
TiXmlAttribute *IDAttribute = FirstPerson->FirstAttribute();
//输出第一个Person的name内容,即周星星;age内容,即;ID属性,即。
cout << NameElement->FirstChild()->Value() << endl;
cout << AgeElement->FirstChild()->Value() << endl;
cout << IDAttribute->Value()<< endl;
}
catch (string& e)
{
return false;
}
return true;
}
由于是处理文件,难免会遇到中文之类的,如果只是用string来表示,难免会出现乱码之类的,所以在源代码中用到了CString以及wstring,是为了保证编码的准确性,但是TinyXML不支持宽字符的,所以要对数据进行处理。CString的c_str()得到的是wchar_t * 类型的数据,所以要写一个函数专门是对宽字符进行转换,函数如下:
std::string ws2s(const std::wstring& ws)
{
std::string curLocale = setlocale(LC_ALL, NULL); // curLocale = "C";
setlocale(LC_ALL, "chs");
const wchar_t* _Source = ws.c_str();
size_t _Dsize = 2 * ws.size() + 1; http://
char *_Dest = new char[_Dsize];
memset(_Dest,0,_Dsize);
wcstombs(_Dest,_Source,_Dsize);
std::string result = _Dest;
delete []_Dest;
setlocale(LC_ALL, curLocale.c_str());
return result;
}
由于程序的需要,这边还对程序一些路径进行获取,这些是调用系统的API进行获取,主要是GetModuleFileName函数,代码如下:
CString GetAppPath()
{//获取应用程序根目录
TCHAR modulePath[MAX_PATH];
GetModuleFileName(NULL, modulePath, MAX_PATH);
CString strModulePath(modulePath);
strModulePath = strModulePath.Left(strModulePath.ReverseFind(_T('\\')));
return strModulePath;
}
运行结果如下:

这个只是一个小测例,主要其中没有对代码的健壮性进行处理,比如如果文件没有创建的时候进行读取 应该有个安全措施,文件的格式和代码读取有差异的时候应该有个容错的机制,xml文件没有正确创建等等问题,这些在真实项目中都是要有体现,这个需要自己去考虑,这边不做详细说明。需要源码的可以点击一下链接进行下载TinyXMLDemo源码
TinyXML操作xml文件TinyXMLDemo源码