正则表达式截取字符串之间的字符串(不包括首尾)
- (void)viewDidLoad {
[super viewDidLoad];
// Do any additional setup after loading the view, typically from a nib.
NSString *txt = @"abc123bcdabc234bcd";
NSRegularExpression *regular = [NSRegularExpression regularExpressionWithPattern:@"(?<=abc)(.*?)(?=bcd)"
options:NSRegularExpressionCaseInsensitive
error:nil];
NSArray<NSTextCheckingResult *> *resultArr = [regular matchesInString:txt
options:NSMatchingReportCompletion
range:NSMakeRange(0, txt.length)];
for (NSTextCheckingResult *res in resultArr) {
NSLog(@"---%@", NSStringFromRange(res.range));
NSString *str = [txt substringWithRange:res.range];
NSLog(@"===%@", str);
}
}
输出:
---{3, 3}
===123
---{12, 3}
===234
解释正则表达式
?<=abc
表示的是abc的后面的字符串,但不包括abc。?=bcd
表示的是bcd的前面的字符串,但不包括bcd。()
是为了方便阅读。
注意:js不支持?<=
分隔符,所以网页版测试正则是无法使用?<=
的。
当对一段无规则的长本文进行指定内容的获取或提取时,运用正则表达式可以有效的提升我们的代码质量,提高我们的代码效率;
最近开发的功能极致的发挥了正则表达式的作用,且用到了多种截取方式。故在此做下总结与记录,希望可以帮到看到此博客的人。
1.截取指定字符串之间的字符串(不含开头与结尾字符串)
在一段文本中,我们指定了固定格式的文本。比如:
a=@${*||名称:NAME||input}
b=@${*||备注:REMARK||input}
我们要对整段文本中固定格式间(此处为‘@${’ 与 ‘}’ 之间)的内容进行提取,则可以用如下正则:
(?<=\\@\\$\\{)(.+?)(?=\\})
完整代码如下:
String pat = "(?<=\\@\\$\\{)(.+?)(?=\\})";
Pattern pattern = Pattern.compile(pat);
Matcher m = pattern.matcher(你要进行提取的文本内容);
while (m.find()) {
int i = 1;
System.out.println(m.group(i));
i++;
}
得到结果就为:
*||名称:NAME||input
*||备注:REMARK||input
2.截取字符串之间的字符串(含开头与结尾字符)
还是在上述的一段文本中,或许我们要进行提取的这段文本中含有换行符,而正则表达式中的 ‘ . ’ 表示除换行符\n之外的任意字符,因此按照上述正则,对有换行的文本提取时便会失效。比如:
…
######杂七杂八的#########
…
``{||这儿是一段文本内容||内容 文本
换行的
文本}``
``{||示例||****}``
……………………
……
如上图所示,我们要截取 ``{ 与 }`` 之间的内容(包含开头结尾),而且此段文本中还包含换行。那么,在此处,我们可以用如下正则:
(?=\``\{)([\s\S]*?)(?<=\}\``)
完整代码如下:
String rule = "(?=\\``\\{)([\\s\\S]*?)(?<=\\}\\``)";
Pattern patter = Pattern.compile(rule);
Matcher matcher = patter.matcher(你要识别并从中提取内容的文本);
while (matcher.find()) {
int i = 1;
System.out.println(matcher.group(i));
i++;
}
执行代码得到的结果为:
``{||这儿是一段文本内容||内容 文本
换行的
文本}``
``{||示例||****}``
原文链接:https://blog.youkuaiyun.com/qq_33230345/article/details/104992725