//IRegex 的属性与方法
IRegex.GetGroupNames; { 子表达式编号数组, 譬如有两个子表达式, 会得到 0,1,2; 这基本无用 }
IRegex.GetGroupNumbers; { 同上, 只是获取的是整数数组 }
IRegex.GroupNameFromNumber(); { 应该是从子表达式编号获取子表达式的名称; 但没有实现, 来回都是编号 }
IRegex.GroupNumberFromName(); { 同上一个是反着的; 基本都无用 }
IRegex.IsMatch(); { 判断是否有所匹配; 如果只想知道是否匹配到, 用它应该最快 }
IRegex.Match(); { 获取一个 IMatch 对象, 这是第一个匹配结果 }
IRegex.Matches(); { 获取一个 IMatchCollection 对象; 这是匹配到的 IMatch 的集合 }
IRegex.Replace(); { 替换 }
IRegex.Split(); { 根据表达式分割字符串; 当前版本没有实现好, 暂时无用 }
IRegex.ToString; { 获取表达式文本 }
IRegex.Save(); { 把表达式保存到流 }
IRegex.Load(); { 从流中取回由 Save 保存的表达式 }
IRegex.Options; { 选项集合, 是只读的; 要设置只能从 Create 方法中 }
{这其中需要重新看看的只有 Replace}
//IRegex 是通过 TRegex 实现的, TRegex 还有下面几个静态类方法:
TRegex.Escape(); { 编码需要转义的字符 }
TRegex.Unescape(); { 还原 Escape 的编码 }
TRegex.IsMatch(); { 同 IRegex.IsMatch }
TRegex.Match(); { 同 IRegex.Match }
TRegex.Matches(); { 同 IRegex.Matches }
TRegex.Replace(); { 同 IRegex.Replace }
TRegex.Split(); { 同 IRegex.Split }
{ 使用这些个类方法会让代码更简单 }
下面是使用类方法简化程序的例子:
uses RegularExpressions;
procedure TForm1.FormCreate(Sender: TObject);
var
Match: IMatch;
MatchCollection: IMatchCollection;
Pattern, Input, str: string;
begin
Pattern := '([A-Za-z]+)(\d+)';
Input := 'AAA1 BBB2 AA11 BB22 A111 B222 AAAA';
//
Match := TRegex.Match(Input, Pattern);
ShowMessage(Match.Value); { AAA1 }
//
MatchCollection := TRegex.Matches(Input, Pattern);
ShowMessage(IntToStr(MatchCollection.Count)); { 4 }
//
str := TRegex.Replace(Input, Pattern, '◆');
ShowMessage(str); { ◆ ◆ ◆ ◆ ◆ ◆ AAAA }
end;
Escape 与 Unescape 测试:
uses RegularExpressions;
procedure TForm1.FormCreate(Sender: TObject);
var
str: string;
begin
str := TRegex.Escape('.$^{[(|)*+?\');
ShowMessage(str); (* \.\$\^\{\[\(\|\)\*\+\?\\ *)
str := TRegex.Unescape(str);
ShowMessage(str); (* .$^{[(|)*+?\ *)
end;
Replace 函数有很多重载, 如:
uses RegularExpressions;
procedure TForm1.FormCreate(Sender: TObject);
var
Regex: IRegex;
Match: IMatch;
Pattern, Input, str: string;
begin
Pattern := '([A-Za-z]+)(\d+)';
Input := 'AAA1 BBB2 AA11 BB22 A111 B222 AAAA';
Regex := TRegex.Create(Pattern);
{ 替换全部 }
str := Regex.Replace(Input, '◆');
ShowMessage(str); { ◆ ◆ ◆ ◆ ◆ ◆ AAAA }
{ 只替换前两个匹配 }
str := Regex.Replace(Input, '◆', 2);
ShowMessage(str); { ◆ ◆ AA11 BB22 A111 B222 AAAA }
{ 从第 10 个字符开始, 只替换两个匹配 }
str := Regex.Replace(Input, '◆', 2, 10);
ShowMessage(str); { AAA1 BBB2 ◆ ◆ A111 B222 AAAA }
end;
Replace 函数中还应该有一个 TMatchEvaluator 事件参数, 它可以执行一些更高级的替换, 遗憾的是当前版本也没有实现.
尽管有不少东西还没实现, 但试用下来感觉还是蛮不错的, 可以放弃 PerlRegEx 了!