关于判定字符中是否有中文等非法字符

本文介绍了一个使用C++实现的字符串编码转换程序,该程序能够将输入的ASCII或Unicode字符串转换为short类型的vector容器存储,并提供了自定义的输出操作符以正确显示转换后的结果。
部署运行你感兴趣的模型镜像
#include <iostream>
#include <vector>
using namespace std;
void asc2cha(const char *in, vector<short>& cha);
ostream& operator << (ostream &o, vector<short>&cha);

int main(int argc, char *argv[]) {
    const char *str = "我爱C++编程";
    vector<short> cha;  //  用一个short来存放一个汉字或西文字符
    asc2cha(str, cha);  //  转换函数
    cout << str << endl
         << cha << endl;
    system("pause");
    return 0;
}


//  从字符串到short的vector
void asc2cha(const char *in, vector<short> &cha) {
    cha.clear();
    while (in[0]) {
           if ((in[0] & 0x80) && in[1]) {  //  中文
            cha.push_back(*(short*)in);
            in+=2;
        }
        if ((in[0] & 0x80) && in[1] == 0) { //  出错
            cha.push_back(in[0]);
            break;
        }
        if ((in[0] & 0x80) == 0) {  //  西文
            cha.push_back(in[0]);
            in++;
        }
    }
}

//  重载输出函数
ostream& operator << (ostream &o, vector<short> &cha) {
    for (int i = 0; i < cha.size(); i++) {
        if (cha[i] & 0xff00) {  //  中文
            o << char(cha[i] & 0xff) << char((cha[i]>>8) & 0xff);
        }
        else {                  //  西文
            o << char(cha[i] & 0xff);
        }
    }
    return o;
}



您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成
ACE-Step

ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联手打造的开源音乐生成模型。 它拥有3.5B参数量,支持快速高质量生成、强可控性和易于拓展的特点。 最厉害的是,它可以生成多种语言的歌曲,包括但不限于中文、英文、日文等19种语言

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值