UNICODE转多字节

本文详细介绍了多字节字符串与宽字符之间的转换方法,包括使用MultiByteToWideChar和WideCharToMultiByte函数的用法,并解决了在Windows CE SDK下转换时遇到的乱码问题。通过提供示例代码和解决方案,帮助开发者正确处理不同字符集间的转换。

String是采用的Unicode编码char使用的Multi-Byte是不一样的,

这函数,使用的是标准C函数。需要头文件cstdlib和clocale。针对中文的unicode写的函数。

//========================================================================

//TITLE:

//   MultiByteToWideChar和WideCharToMultiByte用法详解

//AUTHOR:

//   norains

//DATE:

//   第一版:Monday  25-December -2006

//   增补版:Wednesday 27-December -2006

//   修订版:Wednesday 14-March-2007 (修正之前的错误例子)

//Environment:

//  EVC4.0 + Standard SDK

//========================================================================

 

1.使用方法详解


  在本文开始之处,先简要地说一下何为短字符和宽字符.

 所谓的短字符,就是用8bit来表示的字符,典型的应用是ASCII码.而宽字符,顾名思义,就是用16bit表示的字符,典型的有UNICODE.关于windows下的ASCII和UNICODE的更多信息,可以参考这两本经典著作:《windows程序设计》,《windows 核心编程》.这两本书关于这两种字符都有比较详细的解说.

 

  宽字符转换为多个短字符是一个难点,不过我们只要掌握到其中的要领,便可如鱼得水.

  好吧,那就让我们开始吧.

 

  这个是我们需要转化的多字节字符串:  

  char sText[20] = {"多字节字符串!OK!"};

 

 我们需要知道转化后的宽字符需要多少个数组空间.虽然在这个里程里面,我们可以直接定义一个20*2宽字符的数组,并且事实上将运行得非常轻松愉快.但假如多字节字符串更多,达到上千个乃至上万个,我们将会发现其中浪费的内存将会越来越多.所以以多字节字符的个数的两倍作为宽字符数组下标的声明绝对不是一个好主意.

  所幸,我们能够确知所需要的数组空间.

 我们只需要将MultiByteToWideChar()的第四个形参设为-1,即可返回所需的短字符数组空间的个数:

  DWORD dwNum = MultiByteToWideChar (CP_ACP, 0,sText, -1, NULL, 0);

 

  接下来,我们只需要分配响应的数组空间:

  wchar_t *pwText;

  pwText = new wchar_t[dwNum];

  if(!pwText)

  {

   delete []pwText;

  }

 

  接着,我们就可以着手进行转换了.在这里以转换成ASCII码做为例子:

  MultiByteToWideChar (CP_ACP, 0, psText, -1,sText, dwSize);

 

  最后,使用完毕当然要记得释放占用的内存:

  delete []psText;

 

 

  同理,宽字符转为多字节字符的代码如下:  

  wchar_t wText[20] = {L"宽字符转换实例!OK!"};

  DWORD dwNum =WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,NULL,0,NULL,FALSE);

  char *psText;

  psText = new char[dwNum];

  if(!psText)

  {

   delete []psText;

  }

  WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,psText,dwNum,NULL,FALSE);

  delete []psText;

 

  如果之前我们已经分配好空间,并且由于字符串较短,可以不理会浪费的空间,仅仅只是想简单地将短字符和宽字符相互转换,那有没有什么简便的方法呢?

   WIN32API里没有符合这种要求的函数,但我们可以自己进行封装:

    

 //-------------------------------------------------------------------------------------

  //Description:

  // This function maps a character string to awide-character (Unicode) string

  //

  //Parameters:

  // lpcszStr: [in] Pointer to the characterstring to be converted

  // lpwszStr: [out] Pointer to a buffer thatreceives the translated string.

  // dwSize: [in] Size of the buffer

  //

  //Return Values:

  // TRUE: Succeed

  // FALSE: Failed

  //

  //Example:

  //MByteToWChar(szA,szW,sizeof(szW)/sizeof(szW[0]));

 //---------------------------------------------------------------------------------------

  BOOL MByteToWChar(LPCSTR lpcszStr, LPWSTRlpwszStr, DWORD dwSize)

  {

    // Get therequired size of the buffer that receives the Unicode

    //string.

    DWORDdwMinSize;

    dwMinSize =MultiByteToWideChar (CP_ACP, 0, lpcszStr, -1, NULL, 0);

 

    if(dwSize< dwMinSize)

    {

    return FALSE;

    }

 

    

    // Convertheaders from ASCII to Unicode.

   MultiByteToWideChar (CP_ACP, 0, lpcszStr, -1, lpwszStr, dwMinSize); 

    returnTRUE;

  }

 

 //-------------------------------------------------------------------------------------

  //Description:

  // This function maps a wide-character string toa new character string

  //

  //Parameters:

  // lpcwszStr: [in] Pointer to the characterstring to be converted

  // lpszStr: [out] Pointer to a buffer thatreceives the translated string.

  // dwSize: [in] Size of the buffer

  //

  //Return Values:

  // TRUE: Succeed

  // FALSE: Failed

  //

  //Example:

  //MByteToWChar(szW,szA,sizeof(szA)/sizeof(szA[0]));

 //---------------------------------------------------------------------------------------

  BOOL WCharToMByte(LPCWSTR lpcwszStr, LPSTRlpszStr, DWORD dwSize)

  {

   DWORD dwMinSize;

   dwMinSize =WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,NULL,0,NULL,FALSE);

   if(dwSize <dwMinSize)

   {

    returnFALSE;

   }

  WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,lpszStr,dwSize,NULL,FALSE);

   return TRUE;

  }

 

 

  使用方法也很简单,示例如下:

  wchar_t wText[10] = {L"函数示例"};

  char sText[20]= {0};

 WCharToMByte(wText,sText,sizeof(sText)/sizeof(sText[0]));

 MByteToWChar(sText,wText,sizeof(wText)/sizeof(wText[0]));

 

 这两个函数的缺点在于无法动态分配内存,在转换很长的字符串时可能会浪费较多内存空间;优点是,在不考虑浪费空间的情况下转换较短字符串非常方便.


 

2.MultiByteToWideChar()函数乱码的问题


  有的朋友可能已经发现,在标准的WinCE4.2或WinCE5.0SDK模拟器下,这个函数都无法正常工作,其转换之后的字符全是乱码.及时更改MultiByteToWideChar()参数也依然如此.

 不过这个不是代码问题,其结症在于所定制的操作系统.如果我们定制的操作系统默认语言不是中文,也会出现这种情况.由于标准的SDK默认语言为英文,所以肯定会出现这个问题.而这个问题的解决,不能在简单地更改控制面板的"区域选项"的"默认语言",而是要在系统定制的时候,选择默认语言为"中文".

  系统定制时选择默认语言的位置于:

  Platform -> Setting...-> locale -> default language,选择"中文",然后编译即可.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值