一般来说,正则中的\w表示字符类,等价于[A-Za-z0-9],包括A-Z、a-z、0-9等字符
但是\w是对于unicode编码而言的,其实\w还包括一些俄文字符等
所以为了过滤字符,最好还是使用[A-Za-z0-9],
更多有关于正则的字符编码问题,可以参考《Steve Mansour 》,下附链接
正则表达式中w字符类的深入解析与应用
一般来说,正则中的\w表示字符类,等价于[A-Za-z0-9],包括A-Z、a-z、0-9等字符
但是\w是对于unicode编码而言的,其实\w还包括一些俄文字符等
所以为了过滤字符,最好还是使用[A-Za-z0-9],
更多有关于正则的字符编码问题,可以参考《Steve Mansour 》,下附链接

被折叠的 条评论
为什么被折叠?