关于QT的正则表达式类QRegExp的细节问题

想要匹配格式为“YYYY.MM.DD HH:mm:ss.zzz”的时间,关注点是符号“.”的使用,因为正则表达式的语法中“.”正好是特殊符号,代表可以匹配任何非\n字符。而我们的时间格式中“.”就是代表一个点,因此需要转意。

 

方式一:直接写在代码里QString保存

^((([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-9]{2}|[1-9][0-9]{3})\\.(((0[13578]|1[02])\\.(0[1-9]|[12][0-9]|3[01]))|((0[469]|11)\\.(0[1-9]|[12][0-9]|30))|(02\\.(0[1-9]|[1][0-9]|2[0-8]))))|((([0-9]{2})(0[48]|[2468][048]|[13579][26])|((0[48]|[2468][048]|[3579][26])00))\\.02\\.29)) ([0-1][0-9]|[2][0-3]):[0-5][0-9]:[0-5][0-9]\\.[0-9]{3}$

方式二:通过QLineEdit或者QTextEdit手动输入;程序从界面控件去获取正则表达式

^((([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-9]{2}|[1-9][0-9]{3})\.(((0[13578]|1[02])\.(0[1-9]|[12][0-9]|3[01]))|((0[469]|11)\.(0[1-9]|[12][0-9]|30))|(02\.(0[1-9]|[1][0-9]|2[0-8]))))|((([0-9]{2})(0[48]|[2468][048]|[13579][26])|((0[48]|[2468][048]|[3579][26])00))\.02\.29)) ([0-1][0-9]|[2][0-3]):[0-5][0-9]:[0-5][0-9]\.[0-9]{3}$

 

总结:主要是因为字符串处理导致的。“\.”会被认为是转意,QString会把它处理为“.;但是QEegexp在进行匹配时,需要有一个“\,否则“.”会被认为是一个通配符,而不是我们想要的点。

Qt中,`QRegExp` 和 `QRegularExpression` 是用于处理正则表达式的两个,其中 `QRegularExpression` 是 Qt 5 引入的更现代、功能更强大的,推荐用于处理复杂正则表达式场景,例如过滤包含 ANSI 颜色代码的内容。 ### 使用 QRegularExpression 过滤 ANSI 颜色代码 ANSI 转义序列通常以 `\033`(即 ESC 字符)或 `\x1b` 开头,后接 `[`,然后是若干控制字符,最终以 `m` 结束。为了匹配并过滤掉所有 ANSI 颜色代码,可以使用如下正则表达式: ```cpp QRegularExpression ansiColorRegex("\\x1b$$[0-9;]*m"); ``` 此正则表达式可以匹配如 `\033[0;31m`、`\033[1;32m` 等格式的颜色代码。使用 `QString::replace` 方法可以将这些颜色代码从字符串中移除: ```cpp QString originalString = "This is a \033[0;31mred\033[0m text."; QString cleanedString = originalString.replace(ansiColorRegex, ""); qDebug() << cleanedString; // 输出:This is a red text. ``` 该方法适用于日志处理、终端输出解析等需要清除格式的场景[^2]。 ### 使用原始字符串避免转义 在 C++11 及更高版本中,可以使用原始字符串字面量来避免手动转义反斜杠,使正则表达式更易读: ```cpp QRegularExpression ansiColorRegex(R"(\x1b$$[0-9;]*m)"); ``` 该写法等价于前面的表达式,但无需对反斜杠进行额外转义,提升了代码可维护性[^2]。 ### QRegExp 与 QRegularExpression 的比较 Qt 早期版本使用 `QRegExp` 进行正则表达式处理,但其功能有限,且性能不如 `QRegularExpression`。对于需要匹配复杂模式(如 ANSI 转义序列)的场景,推荐使用 `QRegularExpression`,因为它支持 Perl 兼容正则表达式(PCRE),具有更强的匹配能力和更丰富的 API。 例如,使用 `QRegExp` 过滤 ANSI 颜色代码的方式如下: ```cpp QRegExp ansiColorRegExp("\\x1b$$[0-9;]*m"); QString cleanedString = originalString; cleanedString.remove(ansiColorRegExp); ``` 尽管功能相似,但 `QRegExp` 的语法支持和性能均不如 `QRegularExpression`,因此不建议在新项目中使用。 ### 处理本地编码与字符串转换 在处理包含 ANSI 转义序列的字符串时,可能涉及不同编码格式之间的转换。例如,如果原始数据来自本地编码(如 Windows 系统中的 ANSI 编码),应使用 `QString::fromLocal8Bit` 将其转换为 `QString`: ```cpp QByteArray ansiData = ...; // 假设这是来自本地编码的数据 QString logText = QString::fromLocal8Bit(ansiData); ``` 该方法确保原始数据在转换为 `QString` 时能正确解析非 ASCII 字符[^3]。 ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值