Libxml2 是一个xml c语言版的解析器,本来是为Gnome项目开发的工具,是一个基于MIT License的免费开源软件。它除了支持c语言版以外,
还支持c++、PHP、Pascal、Ruby、Tcl等语言的绑定,能在Windows、Linux、Solaris、MacOsX等平台上运行。
Libxml2主要的优点有:
1. 安装、使用比较简单,容易入门;
2. 支持的编码格式较多,能很好的解决中文问题(使用一个很简单的编码转换函数);
3. 支持Xpath解析(这点对于任意定位xml文档中的节点还是很有用的哦);
4. 支持Well-formed 和valid验证,具体而言支持DTD验证,Schema验证功能正在完善中(目前多数解析
器都还不完全支持shema验证功能);
5. 支持目前通用的Dom、Sax方式解析等等。
Libxml2的在linux下的编译安装:
1. 从xmlsoft站点或ftp(ftp.xmlsoft.org)站点下载libxml压缩包(libxml2-xxxx.tar.gz)
2. 对压缩包进行解压缩: tar xvzf libxml2-xxxx.tar.gz
3. 进入解压缩后的文件夹中运行: ./configure && make && make install 即可。
Libxml2的在windows下的编译安装:
以libxml2-2.6.30为例,解压后,打开cmd窗口,进入libxml2-2.6.30目录:
1. cd win32
2. cscript configure.js compiler=msvc debug=yes
3. nmake /f Makefile.msvc(进入bin.msvc/目录就可以看到生成的库文件:libxml2.dll libxml2.lib
libxml2_a.lib libxml2_a_dll.lib)
4. nmake install, 因为第二步没有指定prefix,所以这里会在win32目录下生成三个目录include/lib/bin,
将这三个目录copy到vc的相应目录(C:\Program Files\Microsoft Visual Studio\VC98)既可以在vc
的工程中直接使用libxml2的头文件和库。
使用libxml2生成xml文档
头文件:
#include "libxml\xmlwriter.h"
#include "libxml\encoding.h"
库文件:libxml2.dll libxml2.lib
代码实例:
因为我的程序中都是UTF-16编码,所以根据testWriter.c中的ConvertInput函数实现的
utf-16到utf8的转换函数:
/**
* ConvertInput:
* @in: string in a given encoding
* @encoding: the encoding used
*
* Converts UTF-16LE@in into UTF-8 for processing with libxml2 APIs
*
* Returns the converted UTF-8 string, or NULL in case of error.
*/
xmlChar *ConvertInput(const wchar_t *in, const char *encoding)
{
xmlChar *out;
int ret;
int size;
int out_size;
int temp;
xmlCharEncodingHandlerPtr handler;
if ( in == 0 )
return (0);
handler = xmlFindCharEncodingHandler(encoding);
if ( !handler )
{
TRACE("ConvertInput: no encoding handler found for '%s'\n",
encoding ? encoding : "");
return (0);
}
/*size为UTF-16编码的字符串字节数*/
size = (int) (wcslen(in) + 1)* sizeof(wchar_t) ;
out_size = size * 2;
out = (unsigned char *) xmlMalloc((size_t) out_size);
if ( out != 0 )
{
ret = handler->input(out, &out_size, (const xmlChar *) in, &size);
if ( (ret < 0) )
{
TRACE("ConvertInput: conversion wasn't successful.\n");
xmlFree(out);
out = 0;
}
}
else
{
TRACE("ConvertInput: no mem\n");
}
return (out);
}
使用xmlWriter APIs写一个xml文档,代码如下:
int rc;
xmlTextWriterPtr writer;
xmlDocPtr doc;
xmlChar *tmp;
/* 创建一个新的xml Writer,无压缩*/
writer = xmlNewTextWriterDoc(&doc, 0);
if (writer == NULL) { return; }
/* 文档声明部分 */
rc = xmlTextWriterStartDocument(writer, NULL, "UTF-16", NULL);
if (rc < 0) { return; }
/* 创建第一个元素"EXAMPLE"作为文档的根元素. */
rc = xmlTextWriterStartElement(writer, (xmlChar*)"EXAMPLE");
if (rc < 0) { return; }
/* 为EXAMPLE增加一个注释作为子元素,因为xmlTextWriter函数都使用
* UTF-8的编码,所以这里对中文注释做一个编码转换*/
/* 假设wchar_t cmt 指向 "这是一个EXAMPLE元素的注释" 的UTF-16串*/
tmp = ConvertInput(cmt, "UTF-16");
rc = xmlTextWriterWriteComment(writer, tmp);
if (rc < 0) { return; }
/*增加一个新的子元素ORDER*/
rc = xmlTextWriterStartElement(writer, (xmlChar*)"ORDER")
if (rc < 0) { return; }
/*为ORDER增加一个子元素,*/
rc = xmlTextWriterWriteFormatElement(writer, (xmlChar*)"NO", "%d",20);
/*结束子元素ORDER,直接调用下面的函数即可*/
rc = xmlTextWriterEndElement(writer);
/*结束元素EXAMPLE*/
rc = xmlTextWriterEndElement(writer);
/*释放xmlWriter的相关资源*/
xmlFreeTextWriter(writer);
/*写XML文档(doc)到文件*/
xmlSaveFileEnc(file, doc, MY_ENCODING);
xmlFreeDoc(doc);
效果:
<?xml version="1.0" encoding="UTF-16"?>
<EXAMPLE>
<!--这是一个EXAMPLE元素的注释-->
<ORDER>
<NO>20</NO>
</ORDER>
</EXAMPLE>