WM5.0下，Unicode转UTF-8的方法 -优快云博客

本文介绍了Unicode编码的概念及其在不同系统平台上的实现方式——Unicode转换格式（UTF）。重点讲解了UTF-8编码的特点，包括它是如何通过变长编码来表示基本ASCII字符和其他Unicode字符的。同时提供了一个在WM5.0环境下实现Unicode到UTF-8转换的示例代码。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

转自http://www.cppblog.com/zhangyq/archive/2008/11/02/65781.html

Unicode主要是为多语言设立的二进制编码，一个字符的Unicode编码是确定的。但是在实际传输过程中，由于不同系统平台的设计不一定一致，以及出于节省空间的目的，对 Unicode 编码的实现方式有所不同。Unicode 的实现方式称为Unicode转换格式（Unicode Translation Format，简称为 UTF）。UTF-8 编码，是变长编码，它将基本7位ASCII字符仍用7位编码表示，占用一个字节（首位补0）。而遇到与其他 Unicode 字符混合的情况，将按一定算法转换，每个字符使用1-3个字节编码，并利用首位为0或1进行识别。
UTF-8其实只是Unicode的一个子集，在WM5.0中实现Unicode到UTF-8的转换，不必用位运算就可以。代码如下：
/////////////////////////////////////////////////////////////////////////////
//Description:
// This function maps a wide-character string to a new character string
//
//Parameters:
// lpcwszStr: [in] Pointer to the character string to be converted
// lpszStr: [out] Pointer to a buffer that receives the translated string.
// dwSize: [in] Size of the buffer
//
//Return Values:
// TRUE: Succeed
// FALSE: Failed
//
//Example:
// MByteToWChar(szW,szA,sizeof(szA)/sizeof(szA[0]));
//////////////////////////////////////////////////////////////////////////////
BOOL WCharToMByte(LPCWSTR lpcwszStr, LPSTR lpszStr, DWORD dwSize)
{
DWORD dwMinSize;
dwMinSize = WideCharToMultiByte(CP_UTF8,NULL,lpcwszStr,-1,NULL,0,NULL,FALSE);
if(dwSize < dwMinSize)
{
return FALSE;
}
WideCharToMultiByte(CP_UTF8,NULL,lpcwszStr,-1,lpszStr,dwSize,NULL,FALSE);
return TRUE;
}
参数LPCSTR lpszStr就是个UTF-8字符串。