今天遇到了一个问题,涉及到如何将一个char *类型的字符串转换成一个USHORT数组的问题。开发环境是VC++6。描述如下:
char *一般保存的是Ansi标准字符串,即西文字符占用1Byte,汉语等东亚文字占用2Byte,长度是动态的。而有些情况下涉及到需将Ansi string转成Unicode string。目前了解到似乎没有现成的函数可以用(也许确实有,如果有知道的同仁还请不吝赐教)。经过分析,unicode的汉字在内存中存储的byte值肯定不在0-255之间,因此凡是连续两个这样的byte的情况肯定是一个汉字。按照这个思路(同时也要感谢这个帖子给我一个解决问题的思路)得出以下一个函数:
void AnsiStrToUSHORTArray(const char *strAnsi, int strLen, USHORT *wStr, int &realLen)
{
BOOL notAsc1 = false;
BOOL notAsc2 = false;
int wCnt = 0;
for (int i=0; i<strLen; i++)
{
if (strAnsi[i]<0 || strAnsi[i]>255)
{
if (!notAsc1)
{
notAsc1 = true;
}
else
{
wStr[wCnt] = MAKEWORD(strAnsi[i], strAnsi[i-1]);
notAsc1 = false;
wCnt++;
}
}
else
{
wStr[wCnt] = strAnsi[i];
wCnt++;
}
}
realLen = wCnt;
}
这样就能够动态的将一个普通字符串转换为符合要求并返回了实际长度的usigned short int数组了。
本文介绍了一种在VC++6环境中将Ansi字符串转换为Unicode字符串的方法。通过分析内存中汉字的存储特性,提供了一个能够动态转换字符串并返回unsigned short int数组及实际长度的函数。
427

被折叠的 条评论
为什么被折叠?



