UTF-8 Validation

本文介绍了一种用于验证输入数据是否符合UTF-8编码规范的C++实现方法。通过位操作来检查每个字节的有效性,对于不同长度的字符进行逐个验证,并确保连续字节正确地以特定模式开始。

按照UTF-8的定义多做几次判断就行,我在判断首byte的时候11000000和00001100这两种情况不好判断,即1在中间的时候不好计数,还是答案简洁:

class Solution {
public:
	bool validUtf8(vector<int>& data) {
        int count = 0;
        for (auto c : data) {
            if (count == 0) {
                if ((c >> 5) == 0b110) count = 1;
                else if ((c >> 4) == 0b1110) count = 2;
                else if ((c >> 3) == 0b11110) count = 3;
                else if ((c >> 7)) return false;
            } else {
                if ((c >> 6) != 0b10) return false;
                count--;
            }
        }
        return count == 0;
    }
};


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值