ShiftJis码->UTF-8, EUC码->JIS码

最新推荐文章于 2021-08-31 13:36:50 发布

极杰子

最新推荐文章于 2021-08-31 13:36:50 发布

阅读量2.5k

点赞数

CC 4.0 BY-SA版权

分类专栏： java 文章标签： null c delete

本文链接：https://blog.youkuaiyun.com/wj3319/article/details/6820667

java 专栏收录该内容

6 篇文章

订阅专栏

这段代码展示了如何将ShiftJis编码的字符串转换为Unicode，然后进一步转换为UTF-8编码。同时，它也包含了一个将EUC编码转换为JIS编码的过程，涉及到对每个字符的位操作和调整。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CString MCR_COMMFUN::SjisToUtf8(CString szSrc)
{
CString szDes = _T("");

int nlen = MultiByteToWideChar( CP_ACP, 0, (LPCSTR)szSrc, -1, NULL, 0 );
wchar_t* pUnicode = new wchar_t[ nlen ];
char* pUtf8 = new char[ szSrc.GetLength() * 3 + 1 ];
memset( pUnicode, 0x00, nlen * 2 );
memset( pUtf8, 0x00, szSrc.GetLength() * 3 + 1 );

// SJIS 仺 Unicode
MultiByteToWideChar(
  CP_ACP,
  0,
  (LPCSTR)szSrc,
  -1,
  pUnicode,
  nlen );

// Unicode 仺 UTF8
nlen = WideCharToMultiByte( CP_UTF8, 0, pUnicode, -1, NULL, 0, NULL, NULL );
WideCharToMultiByte(
  CP_UTF8,
  0,
  pUnicode,
  -1,
  pUtf8,
  nlen,
  NULL,
  NULL );

szDes = CString(pUtf8);

delete[] pUnicode;
delete[] pUtf8;
return szDes;
}

for(int i=0; i<szString.GetLength(); i++)
  {
      unsigned char c1 = szString[ i ];
       if( c1 < 0x80 )
      {

         continue;
      }
     else if( c1 == 0x8e )
      {

          szString.Delete(i, 1);
     }
      else
    {

         EUC→JIS
        unsigned char c2 = szString[ i+1 ];
        c1 = c1 - 0x80;
        c2 = c2 - 0x80;

     if (c1 & 0x01)
    {
         c1 = ((c1 + 1) / 2) + 0x70;
         c2 = c2 + 0x1F;
    }
    else
    {
        c1 = (c1 / 2) + 0x70;
        c2 = c2 + 0x7D;
    }
        if (c1 >= 0xA0) { c1 = c1 + 0x40; }
         if (c2 >= 0x7F) { c2 = c2 + 0x01; }

        //write back
        szString.SetAt(i++, c1);
        szString.SetAt(i, c2);
   }
  }