本地爬虫、网络爬虫
Pattern类:表示正则表达式
Matcher:文本匹配器,读取字符串
本地爬虫过程
find方法:返回true或false,并底层记录子串的起始索引和结束索引+1(包左不包右)
group方法:根据底层记录的索引截取子串并返回
网络爬虫过程

带条件爬取

贪婪爬取
贪婪(默认):尽可能多获取数据
非贪婪:尽可能少获取(数量词后加上?)

替换与切割

分组


捕获分组

非捕获分组

分组总结

本地爬虫、网络爬虫
Pattern类:表示正则表达式
Matcher:文本匹配器,读取字符串
本地爬虫过程
find方法:返回true或false,并底层记录子串的起始索引和结束索引+1(包左不包右)
group方法:根据底层记录的索引截取子串并返回
网络爬虫过程

带条件爬取

贪婪爬取
贪婪(默认):尽可能多获取数据
非贪婪:尽可能少获取(数量词后加上?)

替换与切割

分组



非捕获分组

分组总结

2493
1278
685

被折叠的 条评论
为什么被折叠?