业务需要匹配汉字,给出的正则表达式:\u4e00-\u9fa5
\u4e00-\u9fa5 是匹配Unicode的汉字,C++对unicode支持不怎么好,如果你是windows下的vs编译的程序,普通字符串编译之后都是ANSI编码也就是GBK,L""
字符串则是UTF16 LE
在c++11之后,可以尝试使用u8""
(UTF8) u""
(UTF16)U""
(UTF32)来指定unicode字符串的不同UTF编码形式
如:
u8"\u4e00-\u9fa5"
业务需要匹配汉字,给出的正则表达式:\u4e00-\u9fa5
\u4e00-\u9fa5 是匹配Unicode的汉字,C++对unicode支持不怎么好,如果你是windows下的vs编译的程序,普通字符串编译之后都是ANSI编码也就是GBK,L""
字符串则是UTF16 LE
在c++11之后,可以尝试使用u8""
(UTF8) u""
(UTF16)U""
(UTF32)来指定unicode字符串的不同UTF编码形式
如:
u8"\u4e00-\u9fa5"