在VBA中使用正则表达式受限需要引用Microsoft VBScript Regular Expressions 5.5类库。在VBA界面,“工具”-->“引用”,
定义正则表达式,如下例:
Dim reg As New regexp
With reg
.Global = True
.IgnoreCase = True
.MultiLine = False
.Pattern = "[^\u4E00-\u9FA50-9A-Za-z]+" ‘匹配所有非汉字、非数字0-9、非字母
End With
Content = reg.Replace(Content, ",") ‘将匹配的内容用英文状态逗号替换
- 正则表达式的四个属性说明:
- Global:设置为true表示查找引擎返回找到的所有符合要求的子字符串,设置为false表示只返回找到的第一个符合要求的子字符串。
- IgnoreCase:设置为true表示查找时忽略大小写,设置为FALSE表示查找时区分大小写。
- Pattern:存放正则表达式
- MultiLine:如果为false,则通配符可以匹配换行符。
- 正则表达式有3个方法:
- Execute方法:语法object. Execute(sourcestring as string) as string, object为你定义的正则表达式对象(如:regEX),参数sourcestring为要对其进行查找的字符串(如例中的"这有一本关于VBA的书,它在第二个书柜里")。Execute方法查找并返回符合要求的字符串的集合,相当于使用“查找”功能。 Test方法:语法object. Execute(sourcestring as string) as string,其结构和用法和Execute方法一样,它和Execute方法唯一不同的是Test方法只进行测试查找,而不会返回符合要求的子字符串集合。一般用它判断是否可以找到符合要求的字符串。 Replace方法:语法object.
- Replace(sourcestring as string,Replace) as string, object为你定义的正则表达式对象,参数sourcestring为要对其进行查找的字符串, 参数Replacevar为要替换成的内容(如例中的"book")。
- Replace方法查找并返回符合要求的字符串的集合,然后对集合里的字符串进行替换。相当于先使用“查找”功能然后再使用“替换”功能。
- MatchCollection对象与Match对象
匹配到的所有对象放在MatchCollection集合中,这个集合对象只有两个只读属性:
Count:匹配到的对象的数目
Item:集合的又一通用方法,需要传入Index值获取指定的元素。
一般,可以使用For Each语句枚举集合中的对象。集合中对象的类型是Match。
Match对象有以下几个只读的属性:
FirstIndex - 匹配字符串在整个字符串中的位置,值从0开始。
Length - 匹配字符串的长度。
Value - 匹配的字符串。
SubMatches - 集合,匹配字符串中每个分组的值。作为集合类型,有Count和Item两个属性。