unicode to utf8 转化

最新推荐文章于 2024-12-19 11:56:18 发布

原创最新推荐文章于 2024-12-19 11:56:18 发布 · 661 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#include #null #c

字符编码显示专栏收录该内容

3 篇文章

订阅专栏

本文介绍了一种从宽字符(wchar_t)到多字节(char)的字符串转换方法，包括计算目标字符串长度及逐个字符转换的过程。通过具体实现细节展示了不同Unicode范围内的字符如何映射为对应的UTF-8编码。

#include <stdio.h>
#include <stdlib.h>
#include <wchar.h>

//计算需要的char的长度

int wstr2strLen(const wchar_t *pwstr)
{
     int count = 0;
     int i;
     int len = wcslen(pwstr);
     for(i = 0; i < len; ++i)
     {
          unsigned short tmp = *(pwstr + i);
          printf("tmp num is %0x/n", tmp);
          if (tmp < 0x007F)
          {
               count += 1;
          } else if (tmp > 0x0800)
          {
               count += 3;
           }
          else
          {
               count += 2;
          }
     }
     return count;
}

//单个字符的转化

/*    UCS-2编码(16进制) UTF-8 字节流(二进制)
        0000 - 007F 0xxxxxxx
        0080 - 07FF 110xxxxx 10xxxxxx
        0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx

int W2C(const wchar_t *pw, char *pc)
{
     unsigned short tmp = *pw;
     if (tmp < 0x007F)
     {
          *pc = *pw;
          return 1;
     }
     else if (tmp > 0x0800)
     {
              *pc = 0xe0 | (((*pw >> 8) & 0xf0) >> 4);
              *(pc + 1) = 0x80 | (((*pw >> 8) & 0x0f) << 2) | ((*pw & 0xc0) >> 6);
              *(pc + 2) = 0x80 | ((*pw & 0x3f));
              return 3;
     }
     else
     {
              *pc = 0xc0 | ((*pw >> 8) & 0x03) << 2 | (*pw & 0xc0) >> 6;
              *(pc + 1) = 0x80 | (*pw & 0x3f);
              return 2;
     }
     return 0;
}

//字符串的转化

char *wstr2cstr(const wchar_t *pwstr, char *pcstr, size_t len)
{
     char *ptemp = pcstr;
     if (pwstr != NULL && pcstr != NULL)
     {
          size_t wstr_len = wcslen(pwstr);
          printf("wstr_len is %d/n", wstr_len);
          len = (len > wstr_len) ? wstr_len : len;
          while (len-- > 0 )
          {
               int i = W2C(pwstr, pcstr);
               pwstr++;
               pcstr += i;
          }
          *pcstr = '/0';
          return ptemp;
     }
     return 0;
}