LibXML2不支持中文补遗

本文介绍了LibXML2对于中文的支持情况,并提供了相应的代码实现。LibXML2本身支持中文编码,但API仅处理UTF-8类型的数据。文章提供了一段使用iconv进行编码转换的示例代码,确保在读取和写入时可以正确处理中文。

由于对libxml2的不熟悉,发表了“LibXML2不支持中文”一文。经过不断的接触,发现LibXML2自身已经支持了中文编码.只是他的所有api处理的数据都是UTF-8类型的,所以只要在读入和写入数据时进行相应转换即可!而且libxml2已融合了iconv,以下是代码!flags标示是读入(0)还是写入(1)!已测试通过

uint8_t *convert(uint8_t *in, char *encoding, uint8_t flags)
{
uint8_t *out;
int ret, size, out_size, temp;
xmlCharEncodingHandlerPtr handler;
size = (int) strlen( (char*)in ) + 1;
out_size = size * 2 - 1;
out = (uint8_t *)malloc((size_t) out_size);
if (out) {
handler = xmlFindCharEncodingHandler(encoding);
if (!handler) {
free(out);
out = NULL;
}
}
if (out) {
temp = size - 1;
if ( flags ) {
ret = handler->input(out, &out_size, in, &temp);
}else {
ret = handler->output(out, &out_size, in, &temp);
}
if (ret || temp - size + 1) {
if (ret) {
printf("conversion wasn't successful./n");
} else {
printf("conversion wasn't successful. converted: ");
}
free(out);
out = NULL;
} else {
out =(uint8_t *) realloc(out, out_size + 1);
out[out_size] = 0; /*null terminating out */
}
} else {
printf("no mem/n");
}
return (out);
}

int main(int argc, char **argv)
{
uint8_t *content, *out, *in;
xmlDocPtr doc;
xmlNodePtr rootnode;
char *encoding = "ISO-8859-1";
//char *encoding = "utf-8";
if (argc <= 1) {
printf("Usage: %s content/n", argv[0]);
return (0);
}
content = (uint8_t *)argv[1];


out = convert(content, encoding, 1);
in = convert( out, encoding, 0 );
doc = xmlNewDoc( (xmlChar*)"1.0" );
printf( "%s:%s/n", encoding, out );
printf( "%s:%s/n", encoding, in );
rootnode = xmlNewDocNode(doc, NULL, (const xmlChar *) "root", out);
xmlDocSetRootElement(doc, rootnode);
xmlSaveFormatFileEnc("-", doc, encoding, 1);
free( out );
free( in );
return (1);
}

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值