UTF-8到GBK转换

该博客详细介绍了如何将UTF-8编码的字符串转换为GBK编码,通过MultiByteToWideChar和WideCharToMultiByte函数实现从宽字节到多字节的转换过程,最终得到GBK格式的字符串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

实际就是由宽字节转换为多字节的过程

-------------

首先MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len) 转换UTF-8 到表中UNICODE

然后

WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL); UNICODE转换为标准多字节

这个时候已经是ANSI格式了,其实不是GBK格式,但是一般这个时候编译器和操作系统字符集就能去解决下边的事了,就是说可以直接当普通的char *来用了

---------------

void UTF8ToGBK( char *&szOut )
{
  unsigned short *wszGBK;
  char *szGBK;
  //长度
  int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
  wszGBK = new unsigned short[len+1];
  memset(wszGBK, 0, len * 2 + 2);
  MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);


  //长度
  len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
  szGBK = new char[len+1];
  memset(szGBK, 0, len + 1);
  WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);


  //szOut = szGBK; //这样得到的szOut不正确,因为此句意义是将szGBK的首地址赋给szOut,当delete []szGBK执行后szGBK的内


  //存空间将被释放,此时将得不到szOut的内容


  memset(szOut,'0',strlen(szGBK)+1); //改将szGBK的内容赋给szOut ,这样即使szGBK被释放也能得到正确的值
  memcpy(szOut,szGBK,strlen(szGBK)+1);//最后这个+1不要忘了




  delete []szGBK;
  delete []wszGBK;
}

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值