VC读取utf-8格式文本文件

本文介绍了如何从UTF-8格式的文本文件中读取数据,去除文件头,并将多字节UTF8字符串转换为UNICODE字符串的方法。包括使用C++读取文件、跳过文件头、获取文件大小、读取内容并进行编码转换的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


读取UTF-8格式文本文件
去掉文件头的三个字节,先将文本数据读到char数组之中,然后将多字节UTF8字符串转换成宽字符的UNICODE字符串,然后将UNICODE字符串转换成char型字符串或者直接复制到CString中(UTF-8char都属于MultiByte char,不能直接相互转换)
BOOL ReadUTF8StringFile(CString Path, CString& str)
{

    CFile fileR;
    if(!fileR.Open(Path,CFile::modeRead|CFile::typeBinary))
    {
        MessageBox(NULL,_T("无法打开文件:")+Path,_T("错误"),MB_ICONERROR|MB_OK);
        return false;
    }
    BYTE head[3];
    fileR.Read(head,3);
    if(!(head[0]==0xEF && head[1]==0xBB && head[2]==0xBF))
    {
        fileR.SeekToBegin();
    }
    ULONGLONG FileSize=fileR.GetLength();
    char* pContent=(char*)calloc(FileSize+1,sizeof(char));
    fileR.Read(pContent,FileSize);
    fileR.Close();
    int n=MultiByteToWideChar(CP_UTF8,0,pContent,FileSize+1,NULL,0);
    wchar_t* pWideChar=(wchar_t*)calloc(n+1,sizeof(wchar_t));
    MultiByteToWideChar(CP_UTF8,0,pContent,FileSize+1,pWideChar,n);
    str=CString(pWideChar);
    free(pContent);
    free(pWideChar);
    return true;

}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hanjiangying

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值