ShiftJis码->UTF-8, EUC码->JIS码

这段代码展示了如何将ShiftJis编码的字符串转换为Unicode,然后进一步转换为UTF-8编码。同时,它也包含了一个将EUC编码转换为JIS编码的过程,涉及到对每个字符的位操作和调整。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 CString MCR_COMMFUN::SjisToUtf8(CString szSrc)
{
 CString szDes = _T("");

 int nlen = MultiByteToWideChar( CP_ACP, 0, (LPCSTR)szSrc, -1, NULL, 0 );
 wchar_t* pUnicode = new wchar_t[ nlen ];
 char* pUtf8 = new char[ szSrc.GetLength() * 3 + 1 ];
 memset( pUnicode, 0x00, nlen * 2 );
 memset( pUtf8, 0x00, szSrc.GetLength() * 3 + 1 );

 // SJIS 仺 Unicode
 MultiByteToWideChar(
  CP_ACP,
  0,
  (LPCSTR)szSrc,
  -1,
  pUnicode,
  nlen );

 // Unicode 仺 UTF8
 nlen = WideCharToMultiByte( CP_UTF8, 0, pUnicode, -1, NULL, 0, NULL, NULL );
 WideCharToMultiByte(
  CP_UTF8,
  0,
  pUnicode,
  -1,
  pUtf8,
  nlen,
  NULL,
  NULL );

 szDes = CString(pUtf8);

 delete[] pUnicode;
 delete[] pUtf8;
 return szDes;
}

 

 

for(int i=0; i<szString.GetLength(); i++)
  {
       unsigned char c1 = szString[ i ];
       if( c1 < 0x80 )
      {

          continue;
      }
      else if( c1 == 0x8e )
      {

          szString.Delete(i, 1);
      }
      else
     {    

         EUC→JIS
         unsigned char c2 = szString[ i+1 ];
         c1 = c1 - 0x80;
         c2 = c2 - 0x80;

     if (c1 & 0x01)
    {
         c1 = ((c1 + 1) / 2) + 0x70;
         c2 = c2 + 0x1F;
    }
    else
    {
         c1 = (c1 / 2) + 0x70;
         c2 = c2 + 0x7D;
    }
         if (c1 >= 0xA0) { c1 = c1 + 0x40; }
         if (c2 >= 0x7F) { c2 = c2 + 0x01; }

        //write back
        szString.SetAt(i++, c1);
        szString.SetAt(i, c2);
   }
  }

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值