网页源文件编码转换(UTF-8或BIG-5转换为GB)

本文介绍了一种将网页源文件从不同编码(如UTF-8或Big5)转换为GB2312或GBK编码的方法。通过使用CCodeConverter类,文章详细展示了如何分配内存、进行编码转换,并最终将转换后的字符串重新赋值给原始变量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sContent为存放网页源文件的string串,用到头文件CodeConverter.h(非库文件,他人编写),转换结束后的编码重新赋值给sContent

 

            //转换所需内存申请、赋初值
            size_t nFileSize = sContent.size();
            char *pcTemp = new char[nFileSize+1];
            memcpy(pcTemp, sContent.c_str(), nFileSize);
            pcTemp[nFileSize] = 0;

            size_t nNewCodeSize = 3*sizeof(char)*nFileSize;
            char *pcBuffer = new char[nNewCodeSize];
            memset(pcBuffer, 0, nNewCodeSize);

            //编码转换
            CCodeConverter *pclCodeIconv;
            if (sCharset=="utf-8" || sCharset=="UTF-8")
            {
                pclCodeIconv = new CCodeConverter("UTF-8", "GB2312");
                nNewCodeSize = pclCodeIconv->convert(pcTemp, nFileSize, pcBuffer, nNewCodeSize, 1);        //源码字符类型转换
                sContent = pcBuffer;
                delete pclCodeIconv;
                pclCodeIconv = NULL;
            }
            else if (sCharset=="big5" || sCharset=="BIG5")
            {
                pclCodeIconv = new CCodeConverter("BIG5", "GBK");
                nNewCodeSize = pclCodeIconv->convert(pcTemp, nFileSize, pcBuffer, nNewCodeSize, 1);
                sContent = pcBuffer;
                delete pclCodeIconv;
                pclCodeIconv = NULL;
            }
            else
            {
            }

            delete [] pcTemp;
            delete [] pcBuffer;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值