C++ 读取UNICODE编码格式文本文件

本文介绍了一个从宽字符(wchar_t)转换到窄字符(char)的实用函数ws2s,并展示了如何使用该函数处理二进制文件中的宽字符数据。通过设置系统本地环境为中文环境,确保了宽字符到多字节字符的正确转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 std::string ws2s(const std::wstring& ws)
 {
     std::string curLocale = setlocale(LC_ALL, NULL); // curLocale = "C";
     setlocale(LC_ALL, "chs");
     const wchar_t* _Source = ws.c_str();
     size_t _Dsize = 2 * ws.size() + 1;
     char *_Dest = new char[_Dsize];
     memset(_Dest, 0, _Dsize);
     wcstombs(_Dest, _Source, _Dsize);
     std::string result = _Dest;
     delete[]_Dest;
     setlocale(LC_ALL, curLocale.c_str());
     return result;
 }

bool read(const char* fileName)
{

    ifstream fin;
    fin.open(fileName, ios::binary);
    if(!fin.is_open())
    {
        cout << "open data file failed." << endl; 
        return false;
    }

    size_t index = 2;
    wstring wstrLine;
    int lineIndex = 0;
    while (!fin.eof())
    {
        fin.seekg(index, ios::beg);
        wchar_t wch;
        fin.read((char *)(&wch), 2);
        if (wch == 0x000D) // 判断回车
        {
            string strLineAnsi = ws2s(wstrLine);                    
            wstrLine.erase(0, wstrLine.size() + 1);
            lineIndex++;
            index += 4; // 跳过回车符和行开头符
        }
        else
        {
            wstrLine.append(1, wch);
            index += 2;
        }
    }
    return true;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值